和製生成AIを作る意味ってあるんだろーか。
いわく、GPTは日本語に弱いので、日本語に強い大規模言語モデルを搭載した生成AIが必要とのこと。それで、スパコン「富岳」の計算能力を使うらしい。
日本語を学習させるつもりらしいのだが、そもそも世界の情報のほとんどは英語で記録されているし、今後もその傾向は変わらないし、かつ新鮮な情報であればあるほど英語率が高い。
生成AIと言うからには、世界の最新の情報を取り扱うからこそ威力が発揮できるわけで、情報量の少ない日本語だけを学習した生成AIの生きる道ってあるのだろうか。
「パーフェクトな日本語を話すけど中身が薄い」AIか、「日本語のレベルはネイティブに劣るが情報が濃くて新しい」AIか。
俺だったら、後者を使うけどなー。
前者は情報量という面で克服できない問題を抱えてる。だって日本語の情報ってカンスト寸前じゃん。人口も減ることはほぼ確、それは国力低下を意味する、強い企業もない、国際的な影響力もない。そんななか、最強スパコンで日本語の生成AIかー。
グローバルなフィールドで使えないことが確定してるビジネスを、日本中の叡智を結集してこれからやるのかー。