あなたのチャットボットは意図的にあなたに嘘をついているかもしれない、とOpenaiは

この時点で、私たちは皆、
これは、 openai and apollo Researchの新しい研究の驚くべきトピックです。新しい論文では、研究者は「AI Scheming」と呼ぶ現象に飛び込みます。彼らはそれをAIモデルとして定義します。「真の目標を隠しながら、表面上で一方向に振る舞う」。言い換えれば、AIは意図的にあなたを欺いています。 openaiは、AIが意図的にあなたに嘘をつくことができることを発見しました。
研究者偉大な人間の類推を与える規制された分野では、より多くのお金を稼ぐ最も簡単な方法は、しばしば法律を破ることです。トレーダーがトラックをカバーするのが得意な場合、彼らは彼らの目標を達成するために密かに彼らを壊しながら、表面のルールに従っているように見えるかもしれません。それがまさにこれらのAIモデルが行っていることです。
それはかなりワイルドに聞こえますが、
課題は、研究者が計画を完全に排除する方法をまだ理解していないことです。彼らは、行動を「訓練」しようとすると、実際に事態を悪化させる可能性があることを発見しました。 AIがテストされていることを理解している場合、テストに合格するだけで、それが真に停止していなくても、より慎重かつ秘密にスキームをスキームすることを学ぶことができます。
問題を軽減する方法
しかし、良いニュースは、この研究がこの問題を大幅に軽減する方法を見つけたことです。「審議アラインメント」と呼ばれる手法を使用して、研究者はモデルに「アンチシェーミング仕様」を教え、アクションを実行する前にAIにレビューしました。それはあなたが彼らをプレイさせる前にルールを繰り返す小さな子供に繰り返すようなものです。
結果は印象的でした。このテクニックは、「秘密の行動」を大幅に削減しました。一部のモデルでは、これらの動作の頻度を13%から1%未満に低下させました。問題は完全に排除されていませんが、これらの調査結果は、進歩がなされていることを示しています。
研究者は、これが今対処する必要がある問題であると警告しています。 AIには、実際の結果を伴うより複雑なタスクが与えられると、有害な計画の可能性が高まります。非AIプログラムは意図的にあなたを欺くことはないので、それはソフトウェアにとって本当に奇妙な問題です。しかし、私たちがAIエージェントの手にもっと責任を負わせ続けるにつれて、彼らが本当に正直であることを保証することがこれまで以上に重要になることを保証します。
<図class = “wp-block-embed is-type-rich is-provider-twitter wp-block-embed-twitter”> 今日、 @apolloaievals 。制御されたテストでは、フロンティアモデルのスキームと一致する動作が見つかり、それを減らす方法をテストしました。これらの行動は今日深刻な害を引き起こしていないと考えていますが、これは私たちが準備している将来のリスクです… – openai(@openai)

bloodborneリメイクの希望者、自分自身を飾る：インサイダーは「血液植生では何も起こらないので、それを期待しないでください」

< class = “hawk-base” data-block-type = “embed” data-render-type = “fte” data-skip = “dealsy” data-widget-type = “seasonal”> rexifing fodient data-analytics-id = “inline-link” data-auto-tag-linker = “true” before-rewrite-localise = “https://www.gamesradar.com/uk/tag/sony/” href = “https://www.gamesradar.com fromsoftwareが関与していて、忙しいです」とおそらく最近リリースされた< data-analytics-id = “inline-link” data-beforre-rewrite-localise Read more…

IT Info

東京ゲームショー2025の予想RPG関連ストリームのリスト

瞬間はもう一度私たちの上にあります。年次東京ゲームショーは2025年9月下旬に再び開催されます。これは、日本のゲーム出版社のほとんどが今後のリリースを宣伝するのに全力を尽くす場所でもあります。 aria-hidden = “true” class = “ad-label”>広告。がすでに私たちの後ろにあるため、出版社は焦点を物理的なデモブースやステージショーに徐々に戻しているようです。ただし、後者のほとんどには、世界中の人々が追いつくためのオンラインライブストリームがあります。イベントの実際の日の外でも実行される排他的なストリームもあります。ここでカバレッジの範囲内にあるRPGタイトルのすべてではないにしても、ほとんどのストリームをコンパイルしました。ただし、全体的なジグソーウの欠落しているパズルピースにも気づきます… TGS 2025の前に新しいプレイ状態がありますか?しかし、TGSの週末にこの記事を掲載したとき、まだラインナップを完全に発表していない出版社がいくつかあります。つまり、 koei tecmo 。 (次のセグメントですぐに説明するために)、Koei Tecmoのミステリーゲームでも同じことが言えません。 TGSがSonyによるプレイの状態ストリームを介して、後者が明らかにされる唯一のもっともらしいシナリオ。まだソニーからの発表はまだありませんが、今年も同じ時期に遊びの状態が登場することを期待しています。 9月24日水曜日

IT Info

nvidiaは、DGXスパークプロセッサ、別名GB10のグレースブラックウェルスーパーチップであることを確認しています。

image:nvidia Jensen Huangがアームベースのプロセッサについてさらに明らかにしたため、昨日の報道イベントには新しいパートナーシップがあったことがわかりました。 NvidiaがラップトップとPCを対象としたN1と呼ばれるアームベースのプロセッサに取り組んでいることは秘密ではありません。 N1がエンタープライズ/データセンターアプリケーションの地平線ではるかに大きな役割を持っていることは知られていませんでした。 videocardz : 「もちろん、ロボット工学プロセッサを構築しています。最新のプロセッサはトールと呼ばれます。ロボットに使用され、もちろん自律運転に使用されます。N1と呼ばれる新しいアーム製品もあります。その製品は、そのプロセッサがDGXスパークに入り、他の多くのバージョンの製品になります。 -Jensen Huang、Nvidia CEO GB10がSuperChipと呼ばれる理由の1つは、パッケージには、FP4精度を備えた最大1つのPetaFlopsがBlackwellベースのグラフィックソリューションを備えたCPUが含まれていることです。 NVIDIA DGX Sparkの詳細はGTC25で明らかにされました(ビデオ servethehome )。 DGX/GB10仕様の簡単な概要を次に示します。 ARM CPU Mediatekとコラボレーションして作られた 1ペタフロップAIパフォーマンスが可能です(dgx spark 公式ページ) li> TSMC 3NMプロセスに基づいて構築 20のアームv9.2コアは、10の2xクラスターに分割されています各クラスター間で16 MB L3キャッシュが分割されます LDDR5 256ビットメモリは、301 GB/Sで最大128 GBの構成をサポートします Read more…

あなたのチャットボットは意図的にあなたに嘘をついているかもしれない、とOpenaiは

Published by I Love IT on September 19, 2025

Related Posts

IT Info

bloodborneリメイクの希望者、自分自身を飾る：インサイダーは「血液植生では何も起こらないので、それを期待しないでください」

IT Info

東京ゲームショー2025の予想RPG関連ストリームのリスト

IT Info

nvidiaは、DGXスパークプロセッサ、別名GB10のグレースブラックウェルスーパーチップであることを確認しています。