新しいAI(Large Language Model、略してLLM)が出るたびに、こう思いませんか? 「結局どれが一番いいの?」 「ベンチマークは高いけど、会話すると···