
KRAFTONは、本日(4月9日)、新たにAIモデルブランド「Raon(ラオン)」を発表した。
音声対応大規模言語モデル(LLM)、リアルタイム音声対話モデル、テキスト読み上げモデル(TTS)、ビジョンエンコーダ(画像特徴抽出モデル)の4モデルをグローバルプラットフォーム「Hugging Face」にてオープンソースとして公開している。
「Raon」は、“楽しさ”を意味する韓国語の言葉に着想を得て名付けられたブランド名で、KRAFTONの社名の一部の文字も取り入れている。AI技術を通じて、ゲームの本質的な楽しさを創出したいという同社の哲学を反映したものとなる。
KRAFTONは、データ収集からモデル学習、性能評価に至るまで、ファウンデーションモデル(基盤モデル)開発の全工程を遂行できる技術力を背景に、「Raon-Speech」「Raon-SpeechChat」「Raon-OpenTTS」「Raon-VisionEncoder」の4モデルを公開した。今後は「Raon」を軸に、グローバルでのAI技術競争力を一層強化していく予定だ。

「Raon-Speech」
テキスト中心の言語モデルを拡張し、音声の理解と生成を可能にした音声言語モデルで、90億パラメータ規模を確保している。10B未満の公開音声言語モデルの中で、英語と韓国語の両方においてグローバル最高水準の性能を記録した。これは、音声認識、音声合成、音声ベースの質問応答など7つの主要タスクと40のベンチマークを総合的に評価し、各タスクの平均順位を同等の重みで反映した結果だ。
「Raon-SpeechChat」
ユーザーとモデルが会話中に自然に割り込みながら対話できる、リアルタイム双方向通信(Full-duplex)技術を採用した音声言語モデル。韓国で発表された初のリアルタイム双方向音声モデルであり、双方向通信モデルの評価ベンチマーク3種において、相づち、割り込み処理、応答遅延時間など13の主要タスクの平均順位ベースで、グローバル最上位圏の性能を示している。
「Raon-OpenTTS」
公開音声データのみを用いて学習したテキスト読み上げモデル。従来活用が難しかった一部データについては、KRAFTONが自ら収集・精製した上で公開し、学習データ全体もあわせて公開することで、誰でも同一環境で再現学習できるようになった。人によるブラインド評価では、非公開データを用いたグローバル研究向けTTSモデルと比較しても、最上位レベルの性能を達成している。
「Raon-VisionEncoder」
画像をAIが理解可能な情報へ変換するビジョンエンコーダ。言語モデルと組み合わせることで視覚情報の処理が可能になる。公開データのみ活用し、事前学習済みモデルを用いず、ゼロから独自に学習させた点が特徴となっている。一部の視覚認識タスクでは、Googleの代表的なビジョンエンコーダモデル「SigLIP2」を上回る結果を記録し、その他のタスクでもSigLIP2比で90%以上の性能を示している。この技術は、KRAFTONの「独自AIファウンデーションモデル」プロジェクトにも活用される予定だ。
▼KRAFTON CAIO(最高AI責任者)コメント
「今回の「Raon」モデルシリーズの公開は、当社がAI技術力を着実に蓄積していく上で重要なマイルストーンです。大規模な学習データと中核モデルをオープンソースとして共有することで、研究者や開発者が自由に活用できる環境を整え、マルチモーダル技術の発展と韓国のAIエコシステムの成長に貢献できることを期待しています」
KRAFTONは、ファウンデーションモデルの設計からAIエージェント、新たなゲーム体験を実現するCPC(Co-Playable Character)技術のゲームへの適用まで、AI技術全般にわたる開発力を有している。これを基盤として、2025年には個人向けAIアシスタント「KIRA」を披露し、2026年3月にはAIエージェント性能を高める「Terminus-KIRA」技術をオープンソースとして公開した。
さらに、CPCのようなAIベースのインタラクティブコンテンツを通じて、新たなゲーム体験の拡張にも取り組んでいる。今後もAIモデルおよびAIエージェント技術の高度化を進め、技術革新をリードしていくことを目指す方針だ。
会社情報
- 会社名
- KRAFTON




