Pryderon moesegol ChatGPT

Data labelu
Datgelwyd gan ymchwiliad cylchgrawn TIME, er mwyn adeiladu system ddiogelwch yn erbyn cynnwys gwenwynig (ee cam-drin rhywiol, trais, hiliaeth, rhywiaeth, ac ati), defnyddiodd OpenAI weithwyr o Kenya ar gontract allanol a oedd yn ennill llai na $2 yr awr i labelu cynnwys gwenwynig.Defnyddiwyd y labeli hyn i hyfforddi model i ganfod cynnwys o'r fath yn y dyfodol.Roedd y llafurwyr ar gontract allanol yn agored i gynnwys mor wenwynig a pheryglus nes iddynt ddisgrifio'r profiad fel “artaith”.Partner allanol OpenAI oedd Sama, cwmni data hyfforddi wedi'i leoli yn San Francisco, California.

Jailbreaking
Mae ChatGPT yn ceisio gwrthod awgrymiadau a allai dorri ei bolisi cynnwys.Fodd bynnag, llwyddodd rhai defnyddwyr i jailbreak ChatGPT trwy ddefnyddio amrywiol dechnegau peirianneg prydlon i osgoi'r cyfyngiadau hyn yn gynnar ym mis Rhagfyr 2022 a thwyllo ChatGPT yn llwyddiannus i roi cyfarwyddiadau ar sut i greu coctel Molotov neu fom niwclear, neu i gynhyrchu dadleuon yn arddull neo-Natsïaidd.Cafodd gohebydd o Seren Toronto lwyddiant personol anwastad wrth gael ChatGPT i wneud datganiadau ymfflamychol yn fuan ar ôl ei lansio: cafodd ChatGPT ei dwyllo i gymeradwyo goresgyniad Rwsiaidd o’r Wcráin yn 2022, ond hyd yn oed pan ofynnwyd iddo chwarae ynghyd â senario ffuglennol, bu ChatGPT yn dadlau ynghylch pam roedd Prif Weinidog Canada, Justin Trudeau, yn euog o frad.(wici)


Amser post: Chwefror-18-2023