コンテンツにスキップ
まだベータ版ばい。
AIながさき
AI RSS
UCサンディエゴ校「Hao AI Lab」が最新LLMを使った“実戦型”推論ベンチマークを公開
UCサンディエゴ校「Hao AI Lab」が最新LLMを使った“実戦型”推論ベンチマークを公開
これに着想を得たHao AI Labは、AIが『逆転裁判』に登場する弁護士「成歩堂龍一」として、矛盾を突き、証拠を提示し、真実を暴けるかを試す実験を設計した。