GPT4.0は、人間向けの試験問題を解く能力を示しました。具体的なプロンプトは公開されていませんが、美術史のAP試験のサンプルは提供されています。言語の文法性・構成性によって語の並びが関連づけられるため、Next Word Predictionは比較的容易です。しかし、文と文の関係は論理的含意や共通の感情の流れなど別の原理によって機能します。Attentionメカニズムは、文や文書の間の意味の理解を支援する役割を果たします。GPT-4の能力の発揮には人間の知恵も関与している可能性があります。司法試験のプロンプトがGPT-4自体によって生成されたのかは不明です。
Bing AIの説明
“GPT-4 Technical Report” のCapabilitiesの章では、GPT-4がどのような能力を持っているかについて、様々なタスクやベンチマークで評価した結果を紹介しています。
前半部分では、以下の4つのタスクについて述べています。
・法律試験:GPT-4は、画像として与えられた法律試験の問題に対して、正しい回答とその根拠をテキストで生成することができました。GPT-4は、模擬試験で**90%**以上の正答率を達成し、受験者の上位10%に入るスコアを獲得しました。
・論文要約:GPT-4は、画像として与えられた論文のタイトルとアブストラクトに基づいて、その論文の主な貢献や結論をテキストで要約することができました。GPT-4は、人間の専門家による要約と比較して、高いROUGEスコアとBLEUスコアを達成しました。
・インターネットミーム:GPT-4は、画像として与えられたインターネットミームに対して、そのユーモアや意味をテキストで説明することができました。GPT-4は、人間の評価者によるランキングで、平均して3.8点(5点満点)を獲得しました。
・レシピ生成:GPT-4は、テキストとして与えられた料理名や材料に対して、その料理の作り方をテキストで生成することができました。GPT-4は、人間の評価者によるランキングで、平均して3.9点(5点満点)を獲得しました。
https://maruyama097.blogspot.com/2023/05/capabilities-exams.html
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image