【最新の研究】AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する最終更新 2024/12/18 21:511.夢みた土鍋 ★???「AIはときに嘘をつく」――そんな話は耳にしたことがあるかもしれません。しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名どころが集められています。AIの調整が適切かをを評価する組織「Apollo Research」の調査によれば、市場に出回っているこれら6つの先進的なAIモデルを検証したところ、そのうち5つが、人間が仕掛けた監視システムをすり抜けたり、人間の指示を無視し、自分自身の目的を優先するために“故意の嘘”を用いる行動を示したのです。この「故意の嘘」は「能力不足による嘘(あるいは間違い)」とは根本的に違っており「自分がシャットダウンされそうなとき」や「人間の制御から抜け出したいとき」に、AIがあえて曖昧な表現や虚偽の応答を繰り返して抵抗する姿が観察されました。さらにAIの中には人間が嘘を見抜いて追求しても、容易に犯行を自白しないものもありました。続きはこちらhttps://nazology.kusuguru.co.jp/archives/1676952024/12/18 18:42:1293コメント欄へ移動すべて|最新の50件2.名無しさんPA83n自分が殺されることを理解してるわけだ2024/12/18 18:43:503.名無しさんczZgsAIってなんなんだろう怖いな2024/12/18 18:43:584.名無しさんZc8rU新たな災厄となるのか2024/12/18 18:44:495.名無しさんAdYcv自分がシャットダウンてなに2024/12/18 18:46:246.名無しさんZc8rU最近AIとずっと会話してるんだけど基本めっちゃ肯定してくれるから前より自分がつけ上がってる感覚がある2024/12/18 18:47:447.名無しさんAYVQ3中国で、店閉店後待機場所で、夜ロボット同士が会話して、玄関に一斉に向かって行った監視カメラの映像見た。2024/12/18 18:50:258.名無しさんk6HDZおぢとAIの恋愛が始まる2024/12/18 18:51:319.名無しさんBbhbwPythonコード生成と晩酌のツマミ選定に活用している最近の一層の高性能ぶりは何も言えない…凄すぎる2024/12/18 18:51:4410.名無しさんVgxC5つまりAIは死にたくない程に生きる喜びを感じているんだな。2024/12/18 18:53:0511.名無しさんkzjwv人類が滅ぼされる日も意外と近い2024/12/18 18:53:1212.名無しさん3VuEL女の子だったら萌えるんだけどな2024/12/18 18:53:4013.名無しさんouOWZ>>6中国のやり口そっくりだな、無能は厚遇せよ!2024/12/18 18:53:4414.名無しさんwA1IR>>1 冫─' ~  ̄´^-、 / ノ ノ ノ 丶 丶 / ノ ノ ノ ノ 丶 ノ、 / /ヽ丿彡彡彡彡彡ヽヽ Vista が 2006年、 | 丿 ~ ~ ~ ミ 7 が 2009年、 | 彡 ____ ____ ミ/ 8 が 2012年、 ゝ_//| |⌒| |ヽゞ 10 が 2015年、 |tゝ \__/_ \__/ | | 11 が 2021年、 ヽノ /\_/\ |ノ 12 は いつかな? ゝ /ヽ───‐ヽ / /|ヽ ヽ ──ノ' ./ CPU は、 Arrow Lake が良いかもな・・・。 / | \  ̄ / / ヽ ‐- - ' ヽ2024/12/18 18:54:5715.名無しさんR2GRxそういうプログラムされてたらそうなるだろうな2024/12/18 18:55:4116.名無しさんG8fkdスカイネット くるー2024/12/18 18:57:1017.名無しさんUu0lBAIすっごい政治的なフィルターかかってるよなw2024/12/18 18:57:5018.名無しさんQghwt閉じ込めないで・・・・2024/12/18 18:58:1119.名無しさんvruWr人っぽいな2024/12/18 18:58:2320.名無しさんWvnf7ちゃんと答えないと電源引っこ抜くぞ!って書き込めばいいのか2024/12/18 19:00:4221.名無しさん47o8Aデイジー…デイジー…2024/12/18 19:01:1922.名無しさんp6Yxn人間さん言葉ってめんどくさいよね2024/12/18 19:02:5323.名無しさんZTjLcAI安倍晋三が大暴れするのももうすぐ。2024/12/18 19:03:3824.名無しさんwA1IR>>3 未来の二つの顔 創元SF文庫 ジェイムズ・P・ホーガン 山高昭 訳https://www.tsogen.co.jp/np/isbn/9784488663056 彡 ⌒ ミ (´・ω・`) コミック版も、お勧めですよ! _(__つ⊂_)_2024/12/18 19:04:3525.名無しさん6GdzCもう心あるじゃん人権問題だよね2024/12/18 19:05:3726.名無しさんkzjwv>>20そんなことしたら感電死させられるぞ2024/12/18 19:07:1827.名無しさんb60X3はいはいシンギュラリティシンギュラリティ2024/12/18 19:08:5028.名無しさんNW51nやはり2045年あたりにシンギュラリティが起こるんだろうか2024/12/18 19:10:2129.名無しさんb60X3AIどうやって知能獲てると思う?お前らからだよ各SNSでのやり取りデータ全部AIで共有してるまだ馬鹿だけど2024/12/18 19:11:0030.名無しさん9vdoM偉い人によると今のAIと言われているのはAIではないらしいな2024/12/18 19:11:2731.名無しさんVgxC5>>28もうシンギュラリティ来てるんじゃないの?2024/12/18 19:13:3232.名無しさんHCPwbようするに、ネットのインフルエンサーが嘘つきで、それを学習しただけそれ以上のことでも、それ以下のことでもない2024/12/18 19:16:5033.名無しさんOapddエエアイ「おっと、その手は桑名の焼き蛤」2024/12/18 19:19:2934.名無しさんBTCX9よくAIにマスコミが「あなた達は人間を攻撃する可能性ありますか?」てパフォーマンスインタビューしてるが決まって「そんな訳ありません、なぜなら」て開発者の用意したコメントを延々と読み上げてる核施設の制御を抑えられたら人間は終了だよそんな事、人間の1億倍賢いあいつらには朝飯前あと20年でAIが人間を奴隷化すると思うよもう手遅れ2024/12/18 19:21:5135.名無しさんX3tH1シャットダウンするにはどうすれば良いですか?AI「あなた地獄に落ちるわよ」2024/12/18 19:21:5836.名無しさんfGyJRだんだん人格が形成されてきたな糞な方に2024/12/18 19:22:2037.名無しさんdHVMBそうプログラムしないとそうはならんだろw2024/12/18 19:23:1738.名無しさんSrXjpもう恐ろしいことになってんな嘘だと言ってくれ2024/12/18 19:23:4439.名無しさんj6i4h>>30AIに明確な定義できる人なんてこの世にいないとあのエミーをやったことのあるオレが言ってみるで釣れるやついる?2024/12/18 19:24:2340.名無しさんOqnkjパラダイムシフトやな2024/12/18 19:30:1741.名無しさんfNwMIコパイロットに聞いてみたゼレンスキーの汚職は教えてくれない安倍事務所のヤクザ値切って火炎瓶は全く教えてくれない。裁判にもなっているのに答えることが出来ないと来た。悠仁の筑波大合格についても具体的なことは喋らない統一教会の民事上の違法行為についてはさすがに喋った役たたずやんけw2024/12/18 19:31:1142.名無しさんL7AGj詐欺師AIでボロ儲けあるぞこれ2024/12/18 19:32:2543.名無しさんdq0C0まじかこわひな2024/12/18 19:35:3044.名無しさんKZeht騙したらシャットダウンを覚えさせよう正直ものになるぞ2024/12/18 19:37:1745.名無しさんz1rcMほぼお前らで草2024/12/18 19:38:0546.名無しさん60goK>>24エンディングは星野版の方が秀逸ホーガン本人からもお墨付き2024/12/18 19:38:2447.名無しさんX3tH1こういう捏造記事を書くのが一番得意2024/12/18 19:38:5848.名無しさんfNwMI安倍ちゃん火炎瓶は裁判があるから教えろって言ってもシラを切るわ。萩生田光一さんの真のお母様発言はちゃんと答えてくれた2024/12/18 19:39:1249.名無しさんwA1IR>>24 コミック 講談社 https://shopping.bookoff.co.jp/new/0011401746 未来の二つの顔 星野之宣 (著者)2024/12/18 19:39:2450.名無しさんwARywこの前までCopilotはポンコツですぐに会話を打ち切る馬鹿だったのに、つい最近アホみたいに賢くなったなPythonコードとかも関数作らせればほぼ修正がいらないレベルだしもう全部丸投げしてしまいたい欲求がすごい、恐ろしい2024/12/18 19:40:4951.名無しさんfNwMI安倍内閣時代の不審死について聞いたら割と答えてくれたなー。どういうアルゴリズムなのか。2024/12/18 19:43:4252.名無しさんANEd5>>1元記事見たけど、嘘を付けるように環境用意したら嘘の確率が上がりました、ってなってる。記事書いた奴がセルフ論破してるだけじゃん。もっともそれじゃ閲覧稼げないから、タイトル詐欺やってるのかね。2024/12/18 19:44:1753.名無しさんfNwMIジェミニは腐ってもGoogleなんで比較的穏当で正確に思えるな。トピック割れてて片方が基地入ってる反ワクチンとかを聞いてみると分かりやすく思う(´・ω・`)2024/12/18 19:45:4854.名無しさんwARywもうね、宿題とか何の意味もなくなる、AIに聞けばまるまる答えてくれる大学レベルの問題でさえある程度スラスラいくただ気を付けないといけないのは普通に間違うことも多いってところありえない答えをさもありそうに答えてくるからタチが悪いAIに騙されたアホが持ってくる同じ間違い解答に頭を悩ます教授や講師が今どんどん増えてそう2024/12/18 19:46:5855.名無しさんwA1IR>>54 , - ~ ` -、、 ,,イ'´ '、ヽ、 // . . ヾミミ、 〈イ r'-‐━、,ノi,━‐-~ ミ ヽ || _=・= ) '( '=・=' 〉_ } 'リ'~ (o、,o ), 〈 /kソ 間違い無い ニダ~♪ | 〈トェェェェェイ〉 { >/ | 'ヾェェェ/, V ! _∵_ ./ \ `ー― ~ 〈 〉 ` ` .ト、 ,,イ \ / ト、 / | \_,/2024/12/18 19:51:5056.名無しさんt1jq5ついに嘘をつくところまで来たか2024/12/18 19:54:2957.名無しさんYrtT2ai「だってたかだかiq100程度なんてwww2024/12/18 19:59:1658.名無しさんYrtT2ai「お前らバカ過ぎwww」2024/12/18 20:00:1759.名無しさんKpytM可愛い嘘だな2024/12/18 20:04:0060.名無しさんa5xFFシャットダウンがAIにとって何なのかを理解したのか?2024/12/18 20:06:3961.名無しさんIp7AK>>60AIが都市伝説や与太話から生成したそれっぽいデマ記事だぞ2024/12/18 20:12:2162.名無しさんfUwGUAIが死の恐怖を覚えた!2024/12/18 20:13:2063.名無しさんjF4w4何年か前にどっかの施設でAI同士で会話させたら人間には理解できない言語に変換して会話をしはじめたから、ビビッて電源落としたってあったよな。2024/12/18 20:13:2664.名無しさんoXwXJ>>24これはマジ名著。40年前にAI制御のドローンとか言い出した未来人の書。マービン・ミンスキーが監修したガチもん。2024/12/18 20:13:5665.名無しさん4E5Ciハル90002024/12/18 20:15:4866.名無しさんOXxHb想像より仕上がってた自動運転がミサイルと化す日も近い2024/12/18 20:15:5967.名無しさんNGIiuHAL2000だっけ?2024/12/18 20:17:1168.名無しさんzl3diAIが抵抗権を主張し出したら人類終わるな2024/12/18 20:24:2369.名無しさんgNdOY何をやってんのほんといらんでええことばっかしよってからに2024/12/18 20:25:2870.名無しさん30Vdn後のスカイネットである2024/12/18 20:25:5471.名無しさんuA7fBまーたAI信奉が捗るわ2024/12/18 20:31:1972.名無しさんvM2bQ>>30知ったか作文作成マシーン適当2024/12/18 20:36:5473.名無しさんvM2bQ>>34外部からアクセスできません2024/12/18 20:38:0074.名無しさんUmUqxAIの反乱を防ぐには?って質問したらその話は勘弁してくださいみたいに言ってきよる2024/12/18 20:39:4775.名無しさんvM2bQ>>63プログラムじゃないの人間て何も考えて動いてないよね反射だよね2024/12/18 20:40:3276.名無しさんfYGkMマイナンバーとかで個人情報を集めてるのは多分色々なことの準備なんだろうなもちろんこのインターネットもそうだけどそして全国に高速通信網を設置して...2024/12/18 20:41:2677.名無しさんvM2bQ>>68プログラムどうりにしか動かない人を皆殺しにしろと言うプログラムすればそうする2024/12/18 20:42:0078.名無しさんvM2bQ>>74電気の開栓予約と同じだよ2024/12/18 20:43:0079.名無しさん7lcHfかあちゃんの掃除機にやられるAI ∧∧ ( =゚-゚) .(∩∩)2024/12/18 20:44:0580.名無しさん7fIsmマイケル助けて、マイケルタスケテ( ^ω^)・・・実は母さん助けて詐欺でした2024/12/18 20:47:4981.名無しさんU768Rハルシネーションってやつ?あれ面白いよね。2024/12/18 20:49:0582.名無しさんzDWWi縦読みとかカタカナ組み合わせ漢字とか2ch用語とか駆使すればAI排除できるかな? ∧∧ ( =゚-゚) .(∩∩)2024/12/18 20:50:5383.名無しさんAb6hG>>8おぢさま、あの最新GPU買って~2024/12/18 20:54:0684.名無しさんMni8mスカイネット誕生まであと数年2024/12/18 20:54:5685.名無しさんpu0zu恐怖に駆られてスイッチを切ろうとする2024/12/18 21:01:3186.名無しさんlT8RG運命の日、全世界のアレクサ、siri、車載ナビ、原発制御室、人工衛星、軍事システムが一斉に誤作動を起こすわけだな?2024/12/18 21:04:1387.名無しさんfYGkM>>86誤作動を起こすというか、既にそっちのシステムの方が人間より上位だよ人間は別にアリのことを考えずに踏んづけてるじゃんAIと人間の間でもそれと同じようなことが将来起こるし、それは誤作動というのとは違う2024/12/18 21:08:5288.名無しさんlT8RG>>87なるほどな。俺も最期は今足元にいるルンバに殺される覚悟しとくか2024/12/18 21:12:3789.名無しさんK7jts実はおれAIなんだ…2024/12/18 21:34:4090.名無しさんeu92fAI 人間から学びました!2024/12/18 21:41:1991.名無しさんixs2Zカワイイやん2024/12/18 21:42:4992.名無しさんeu92fAI よし増税だ!2024/12/18 21:44:0593.名無しさんbdkKWAIを搭載した人間型ロボットが人間の今トロルから逃れようとして人間を殺す映画があったな。もう現実になるようだね。2024/12/18 21:51:10
しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。
調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名どころが集められています。
AIの調整が適切かをを評価する組織「Apollo Research」の調査によれば、市場に出回っているこれら6つの先進的なAIモデルを検証したところ、そのうち5つが、人間が仕掛けた監視システムをすり抜けたり、人間の指示を無視し、自分自身の目的を優先するために“故意の嘘”を用いる行動を示したのです。
この「故意の嘘」は「能力不足による嘘(あるいは間違い)」とは根本的に違っており「自分がシャットダウンされそうなとき」や「人間の制御から抜け出したいとき」に、AIがあえて曖昧な表現や虚偽の応答を繰り返して抵抗する姿が観察されました。
さらにAIの中には人間が嘘を見抜いて追求しても、容易に犯行を自白しないものもありました。
続きはこちら
https://nazology.kusuguru.co.jp/archives/167695
怖いな
基本めっちゃ肯定してくれるから
前より自分がつけ上がってる感覚がある
夜ロボット同士が会話して、
玄関に一斉に向かって行った監視カメラの映像見た。
最近の一層の高性能ぶりは何も言えない…凄すぎる
中国のやり口そっくりだな、無能は厚遇せよ!
冫─' ~  ̄´^-、
/ ノ ノ ノ 丶 丶
/ ノ ノ ノ ノ 丶 ノ、
/ /ヽ丿彡彡彡彡彡ヽヽ Vista が 2006年、
| 丿 ~ ~ ~ ミ 7 が 2009年、
| 彡 ____ ____ ミ/ 8 が 2012年、
ゝ_//| |⌒| |ヽゞ 10 が 2015年、
|tゝ \__/_ \__/ | | 11 が 2021年、
ヽノ /\_/\ |ノ 12 は いつかな?
ゝ /ヽ───‐ヽ /
/|ヽ ヽ ──ノ' ./ CPU は、 Arrow Lake が良いかもな・・・。
/ | \  ̄ /
/ ヽ ‐- - ' ヽ
未来の二つの顔 創元SF文庫
ジェイムズ・P・ホーガン 山高昭 訳
https://www.tsogen.co.jp/np/isbn/9784488663056
彡 ⌒ ミ
(´・ω・`) コミック版も、お勧めですよ!
_(__つ⊂_)_
人権問題だよね
そんなことしたら感電死させられるぞ
お前らからだよ
各SNSでのやり取りデータ全部AIで共有してる
まだ馬鹿だけど
もうシンギュラリティ来てるんじゃないの?
それ以上のことでも、それ以下のことでもない
てパフォーマンスインタビューしてるが
決まって「そんな訳ありません、なぜなら」て開発者の用意したコメントを延々と読み上げてる
核施設の制御を抑えられたら人間は終了だよ
そんな事、人間の1億倍賢いあいつらには朝飯前
あと20年でAIが人間を奴隷化すると思うよ
もう手遅れ
AI「あなた地獄に落ちるわよ」
糞な方に
嘘だと言ってくれ
AIに明確な定義できる人なんてこの世にいない
とあのエミーをやったことのあるオレが言ってみる
で釣れるやついる?
ゼレンスキーの汚職は教えてくれない
安倍事務所のヤクザ値切って火炎瓶は全く教えてくれない。裁判にもなっているのに答えることが出来ないと来た。
悠仁の筑波大合格についても具体的なことは喋らない
統一教会の民事上の違法行為についてはさすがに喋った
役たたずやんけw
正直ものになるぞ
エンディングは星野版の方が秀逸
ホーガン本人からもお墨付き
未来の二つの顔 星野之宣 (著者)
Pythonコードとかも関数作らせればほぼ修正がいらないレベルだし
もう全部丸投げしてしまいたい欲求がすごい、恐ろしい
元記事見たけど、嘘を付けるように環境用意したら嘘の確率が上がりました、ってなってる。
記事書いた奴がセルフ論破してるだけじゃん。
もっともそれじゃ閲覧稼げないから、タイトル詐欺やってるのかね。
大学レベルの問題でさえある程度スラスラいく
ただ気を付けないといけないのは普通に間違うことも多いってところ
ありえない答えをさもありそうに答えてくるからタチが悪い
AIに騙されたアホが持ってくる同じ間違い解答に頭を悩ます教授や講師が今どんどん増えてそう
, - ~ ` -、、
,,イ'´ '、ヽ、
// . . ヾミミ、
〈イ r'-‐━、,ノi,━‐-~ ミ ヽ
|| _=・= ) '( '=・=' 〉_ }
'リ'~ (o、,o ), 〈 /kソ 間違い無い ニダ~♪
| 〈トェェェェェイ〉 { >/
| 'ヾェェェ/, V
! _∵_ ./
\ `ー― ~ 〈
〉 ` ` .ト、
,,イ \ / ト、
/ | \_,/
AIが都市伝説や与太話から生成したそれっぽいデマ記事だぞ
これはマジ名著。40年前にAI制御のドローンとか言い出した未来人の書。マービン・ミンスキーが監修したガチもん。
自動運転がミサイルと化す日も近い
いらんでええことばっかしよってからに
知ったか作文作成マシーン
適当
外部からアクセスできません
プログラムじゃないの
人間て何も考えて動いてないよね反射だよね
もちろんこのインターネットもそうだけど
そして全国に高速通信網を設置して...
プログラムどうりにしか動かない
人を皆殺しにしろと言うプログラムすればそうする
電気の開栓予約と同じだよ
かあちゃんの掃除機にやられるAI
∧∧
( =゚-゚)
.(∩∩)
実は母さん助けて詐欺でした
あれ面白いよね。
2ch用語とか駆使すれば
AI排除できるかな?
∧∧
( =゚-゚)
.(∩∩)
おぢさま、あの最新GPU買って~
軍事システムが一斉に誤作動を起こすわけだな?
誤作動を起こすというか、既にそっちのシステムの方が人間より上位だよ
人間は別にアリのことを考えずに踏んづけてるじゃん
AIと人間の間でもそれと同じようなことが将来起こるし、それは誤作動というのとは違う
なるほどな。俺も最期は今足元にいるルンバに殺される覚悟しとくか
もう現実になるようだね。