日本語 LLM ベンチマークの現状——JGLUE・llm-jp-eval が示すもの
日本語の大規模言語モデル(LLM)をどう評価するかは、長らく研究コミュニティの関心事だった。英語中心のベンチマークを直訳しても日本語特有の言語現象は測れず、かと…
最新の記事
日本語の大規模言語モデル(LLM)をどう評価するかは、長らく研究コミュニティの関心事だった。英語中心のベンチマークを直訳しても日本語特有の言語現象は測れず、かと…
「日本はロボット大国」という認識は、産業界では既に過去のものに近い。ハードウェアの製造技術では依然として国際的な評価を得るが、出荷台数と市場シェアの推移を統計で…
東京を拠点にする Sakana AI が、設立から短期間で国際的に注目される理由は、モデルを公開しているからだけではない。モデルを「作る」のではなく「組み合わせ…
半導体輸出規制は、経済安全保障と産業競争力の二つの要請が真正面から衝突する領域だ。日本政府の判断は、米国の要請、中国市場の重要性、そして国内装置メーカーの経営実…
生成 AI の普及と並行して、著作権法との関係をどう整理するかは、出版・放送・エンタメ各業界に現実的な影響を及ぼす論点になった。日本では、文化庁審議会が 202…
サイバーセキュリティ基本法の改正および関連ガイドラインの見直しは、特定産業の IT 部門だけでなく、経営層や取締役会レベルでの議論対象になってきた。改正内容を整…
スマートフォン上でのマンガ消費は、出版社とプラットフォームの関係を書き換えてきた。店頭で単行本を買うという行動から、アプリ内で 1 話ずつ読み進める行動へ——こ…
Apple Vision Pro は、発表時の注目度と実販売数のギャップが比較的明確なプロダクトだ。米国発売から約 4 ヶ月遅れで日本市場に投入されてから 1 …
任天堂 Switch 後継機への関心は、ハード製品の発表サイクルを超えた規模でゲーム業界全体に影響を与えている。ソフトメーカー、小売、周辺機器ベンダー、それぞれ…
日本で金融 × テクノロジーの実証実験を合法的に行う枠組みとして、2017 年に施行された「プロジェクト型『規制のサンドボックス』制度」は、内閣官房主導のもとで…
楽天モバイルの参入は、日本の通信業界にとって久々の新規プレーヤー登場だった。ソフトバンクが 1990 年代に業界に参入して以来の本格的な挑戦であり、同時に、従来…
ソフトバンクグループのビジョンファンドは、2017 年の設立以来、世界最大級のテック投資ファンドとして話題を集めた。しかしその評価は、WeWork の IPO …