【連載】AIという“黒船"-AIベンチャーAiHUBに見る新時代に日本がとるべき方策 中山淳雄の「推しもオタクもグローバル」第98回
2022年7月、画像生成AI「Midjourney」のデビューは鮮烈だった。追うように「StableDiffusion」もサービスがローンチされ、そこから1年たった2023年8月までに人類が生み出したAI生成画像は約150億枚(Stable Diffusionで126億枚、Midjourney・Adobe Firefly・Open AIのDALL-E2でそれぞれ10億枚ずつ)。たったこの1年で、1826年から150年以上かけて人類が撮り続けてきた写真枚数をこえてしまうほどの量が「生成」されたのだ。その中にはピカチュウもあれば初音ミクもあり、素人でも著作物を簡易に描けるし合成もできる、といった時代にあって、まさに200年前に機械と初めて直面した人類が処すべきだった対応に今我々が新たにさらされているといった状況にある。今回は約40年にわたってコンピュータ浸透の歴史を見守ってきた、AIベンチャーAiHUBのCTO新井氏に、今日本が岐路に立たされている現状を語ってもらった。
【主な内容】
■5兆円から50兆円産業となるAI“黒船"来航。今日本が行うべき対応、そしてアニメ業界は10兆円産業に
■1980年代元祖AIの研究学生がLinuxOSS原理主義者となり、博覧会シミュレーターライド、ゲームの仕事へ
■音楽ストリーミング第一世代。敵を知り、己を知らば、百戦危うからずや
■最先端のAI研究論文が数日で実装。1000倍速になったUpdate時代
■Webローマ帝国時代の終焉。日本企業が「うまい負け方」をするために必要なこと
■5兆円から50兆円産業となるAI“黒船"来航。今日本が行うべき対応、そしてアニメ業界は10兆円産業に
――:自己紹介からお願いいたします。
生成AIを研究開発するAiHUBで代表取締役CTOをしております新井モノと申します。“洗い物"が苦手なので、それを使ったハンドルネームです。会社は1年前(2023年4月)に作ったんですがオフィス契約したのがちょうど1カ月前(2024年3月)。今会社としてはフルタイムで10名、業務委託で30名。ライトに関わっている人いれると60~300名くらいになるかもしれませんね。
――:なぜご本名で活動しないのでしょうか?
AI業界もそうなんですが、私はWeb1.0の時代からのエンジニアでして、ずっとスレッドなどでハンドルネームで発信する文化があったんです。特にAIプロダクトを作っていると身バレも含めて実名でやっている人がほとんどいない、というのが当たり前の状態になっていて、その流れで私も本名ではなくこちらの名前で動くようになりました。
――:確かにこうやって貴社のページをみると・・・「絵ずら」としてのバラエティがすごいですね笑。すんごい美人がいるな!と思ったら、それを描いている中年男性だったりするし。
そうですね、CEO/CTO/CIO/COO/CMOはちゃんと自分の顔出してますけどね。まあハンドルネームもアバターもこの業界ではそれが名刺のようなものですので・・・笑。
――:AiHUBという会社は具体的にはどんなことをやっているのでしょうか?
生成系AIとエンタメを融合する研究開発や事業開発全般をやっております。AIディープテック知見や、基盤モデル開発・GPUつかった計算機資源を提供して「バーチャルヒューマン」「AITuber」を制作したり、「動画」「マンガ」「ファッション」「音声」などの各産業でAIを使ったビジネスを支援していきます。画像生成系AIのオープンソースコミュニティ初のAIディープテックスタートアップで、会社にいっぱい研究者やエンジニアを抱えるというよりは、オープンソース開発コミュニティもつなぎこみながら、一緒にプラットフォームづくりを支援していきます。
※AiHUBの事業モデルを図示したもの
――:資金調達はすでに実行されたんですか?
まだエンジェルラウンドですが、2023年末に合計3億円を調達しています。出資者はいわゆるVCとかではなく、匿名なのですが皆さんが知っているような方々やトップクリエイターさんなどが入ってます。
――:新井さんとは一緒に経産省のAI研究部門とディスカッションしたときにご一緒させていただきました。ああいった「行政を巻き込む動き」を一新興企業のAiHubがやっているのは何のためなんですか?個社の利益追求、ではないですよね?
「寡占への対抗」なんですよね。独占的なAIと民主的なAIに分けたときに、今の潮流が独占側に流れているんです。Web2でGAFAMが悪名高いのは、例えばFacebookのように自分個人の情報としてアップして上げ続けたデータが、結果広告利用されてFacebookの収益最大化のために使われる。削除を要求してもそれの所有権はFacebookにあるといわれてしまう。
便利便利と我々が使いまくった挙句、それがいいように個社・個別の組織の収益に寡占されてしまったりする。もしかすると今のAIもいつか我々をユートピアではなくディストピアに導くかもしれない。
――:なるほど。今のAIの潮流にリスクがあり、行政と民間が一緒になってルール・メイキングしないと将来的に危険なことになるよね、ということなんですね。
今Midjourneyが月4,000万Viewとかされて、2023年の1年で3億ドル(450億円)という売上にもなっている。Stable DiffusionはLinux上でオープンソースでどんどん使われるようになっている。いまこの段階で日本の政・官・民が現在起こっていることのリテラシーをあげ、「御し方」を考えておかないと20年前のデジタル敗戦と同じことになってしまう。
――:デジタルヒューマンなどもその一環でしょうか。
NECとイーソリューションズが主導になって「デジタルヒューマン協議会」というのが立ち上がりました。TOPPAN、コーセー、スギ薬局、セブン銀行、SENSY、デジタルヒューマン、テレビ東京コミュニケーションズ、東武トップツアーズ、小学館集英社プロダクションにAiHUBも名を連ねて、デジタルヒューマン白書をリリースしました。
こちらも人間の仕事を奪うなどリスク警告の文脈で使われることが多いですが、どんな技術によってなりたち、「おもてなし」「反復練習台」「監視員」「デジタルアイドル」など使い方のイメージや実例などを紹介しています。
――:AiHUBさんとしてはエンタメ業界に向けてはどんな取り組みをされてますか?ひとまず現状はアニメ生成AIを中心に動かれてますね。
はい、現在アニメの国内1.6兆円市場はAIを使うことで10兆円にすることができるのではないかと思っています。こちらも使い方のパターンとしては「創造性」(クリエイターがAIを使った面白いクリエイティブができるか)、「教育」(どうやってAIを使っていくか、画力/スキルアップ)、「作業サポート」(モブ描画や素材張り込み、中割、背景など部分支援)、「効率化」(コストダウン、スケジュール短縮)などです。
基本的に今あるものを奪うのではなく効率化したりサポートすることで人手不足を解消しヒトがより重要な領域に集中することができる、というポイントでAiHUBとしての支援領域を提案しています。
――:なるほど、すでに実例は出ているのでしょうか?
まず制作フローにAIを組み込んでみる。次にそれをマルチメディアに展開してみる。トレーサビリティがあるので海賊版にも対応できるようになっている。あとはそれをビックテック(Microsoft)など寡占のものだけに頼らず分散する。そういったプロセスを現在いくつかのアニメ制作会社さんと取り組みしております。
――:生成AIは100年前の“電気"のような存在になるのではないかとみられています。実際どのくらいの市場を想定していたらよいのでしょうか?
この図のように、現在5.6兆円の生成AI産業が、5年後には10倍、10年後には30倍くらいになるのではないかと想定しております。
■1980年代元祖AIの研究学生がLinuxOSS原理主義者となり、博覧会シミュレーターライド、ゲームの仕事へ
――:新井さんはどんな学生時代を過ごしていたんですか?
1980年代当時から私はずっとLinuxのOSS(オープンソースソフトウェア)コミュニティでしている人間でした。IBMなどのメインフレームの世界と対抗しようとして、あらゆるものをオープンソースにしてコミュニティ指向で解決していくのである、というメンバーが集まっていました。
ちょうどPC-9801(NEC、1982~)があって私自身はFM TOWNS(富士通、1989)からにちょうどPCをいじりはじめましたくらいです。学部も管理科学科だったこともあって、オペレーションリサーチの一環でAIを研究していたんです。まあ当時のAIって、いっても畜産業で豚に肥料をあげるときにアクティブに建物が自動でエサをあげられるようにしたり、とか熱の最大効率化、とかの領域でしたが。なので今のAIの動きは実は30年以上前からやっているんです笑
※UNIX:1960年代半ばにMIT、ベル研究所、GEが共同研究していた時代に端を発し、1969年にあくまで私的な研究の一環から生まれ、1980~90年代にOS(オペレーションシステム)として普及していく。そうした中で1983年にリチャード・ストールマンがフリーソフトウェア財団を設立し、再配布自由・改変自由なUNIXクローンをつくっていく運動があり、これがのちの「Linux」につながっていく。
――:AI30年、ってすごいですね!1990年代のWeb1.0時代よりさらに昔ですね、、、。皆さん、どういう人たちがやっていたんですか?
もう「ソフトウェアは水や空気と同じように、誰もがフリーでアクセスできるべきもの」という原理主義みたいな発想してたんです。日本Linuxユーザ会(JLUG)というのが1983年に発足するんですが(1999年に日本Linux協会となる)、そのコントリビューター(貢献者)たちの本拠地が島根にあるんですよ。皆昼間は会社で働いて、夜にPC上で活動する集団です。私も東京で普通の開発会社に勤めましたが、その後起業してからは岡山を拠点にそのLinuxまわりの仕事をしていました。
――:なぜ島根なんですかね?ITって都会のほうが有利なものなんじゃないですか?
なんですかね、Linuxを使った大規模な伝送の会社が島根県にあったんですよね。Ruby開発者のまつもとゆきひろさんなんかも島根出身ですよね。
OSS主義を貫いているのって、いまでいうとイーサリアム開発したヴィタリク・ブテリンみたいな連中ですよ。ゼロイチでネットワークエフェクトだけでコールドスタートしていくべきだ、企業の介在余地なんて許さない!といったある意味“狂信的"なゴリゴリのエンジニア集団でした。だんだんそうした初期の人たちが追い出されて行って、大人が運営するようになって今ではずいぶんニュートラルな団体になってますけどね。
※まつもとゆきひろ(1965~);鳥取で育ち、1990年筑波大学第三学群卒業後に島根大学大学院で博士課程取得退学。1993年に効率的に記述できる言語をとRuby開発をはじめ(当時は静岡県浜松市在住)、1995年にRubyを公開。1997年より島根県松江市に在住。2005年度日本OSS貢献者賞、2012年内閣府から「世界で活躍し『日本』を発信する日本人」に選出された。
※ヴィタリク・ブテリン(Vitalik Buterin:1994~)ロシア系カナダ人として高校時代から『Bitcoin Magazine』の編集をしたり国際情報オリンピックで銅メダルなどを獲得し、進学したウォータールー大学時代にETH(イーサリアム)の原型となるプロジェクトに取り組む。ピーター・ティールの運営する「ティール・フェローシップ」を受け、2014年に自主退学後、19歳の時点でビットコインに代わる仮想通貨としてETHをリリースする。
――:しかしLinuxって僕は記憶でいうとTRON坂村健教授なんですよね。当時はマイクロソフトがOSを、Googleが検索を、みたいに1社が握るイメージはなかったです。
いまも全然Linuxって残ってますよ。インターネットのサーバーは、そもそもほとんどLinuxで作られてますし、Android自体もLinuxをリブランディングしてフォーク(派生)して作ったものですしね。我々がみているGAFAの世界ってもう氷山の一角で、海面からはみえない巨大な下半分は壮大なOSSのコミュニティから作られているんです。
※坂村健(1951~)東京大学名誉教授、日本のコンピュータ科学者として1984年に国産OSを作るべきだとTRONプロジェクトを推進。いまとなれば坂村氏のユビキタスインターネットIoT(偏在するネット)を先取りした先進的な議論であったが、当時「日の丸OS」として95社もの日本企業が国産のみでOSを作っていくことを主張するもので、米国からのスーパー301条での介入もあり未実現に終わった。
――:新井さんは大学中退後は東京で普通の会社員として働かれているんですね?
はい、電通からの受託で都市博の仕事なども手伝っていました。当時は博覧会だけじゃなくて、CGの仕事なんかもどんどん増えていました。
※世界都市博覧会:1996年3-10月に臨海副都心で開催される予定だった万博的な博覧会。都知事鈴木俊一の執念で1990年ごろから推進されてきたプロジェクトで1991年バブル景気終焉後に不安視される中でも止まらなくなった。進出企業の契約辞退と都民からの反対も抑えきれなくなり、新たに都知事となった青島幸雄が1995年に中止を宣言、損失額は610億円に及んだ。
――:『ジュラシックパーク』でCGに一気に注目が集まったのが1990年代ですよね。以前ポリゴン・ピクチュアズさんを取材しましたが 、ポリゴン(1983)、白組(1973)、デジタルフロンティ(1993)が日本三大CG会社と言われていました。
僕がやっていたのは『ジュラシックパーク』以前のプレCG時代からです。これからは2Dが3Dになるよと言われ、CGで操船や軍事用シミュレーターとかを作っていました。大学在学中に就職した日本セルモという会社に所属するようになるんですが、そちらも「日本のルーカスアーツ」と言われるような会社だったんです。ビジュアルサイエンス研究所(1991年設立)やデジタルハリウッド大学(1994年設立)なんかも始まっていた時代です。
その後ゲーム開発会社を友人と起業しバンダイさんの名刺カードダスや、バンプレストさんから発注を受けコンビニキャッチャーを作ったりもしていました。この時期は3年ひと昔でどんどん技術進化するものだから、そのたびに違うことをやっていた認識ですね。
そのうちネットが出てきて、ベッコアメみたいなプロバイダもでてくる中で、1996年に岡山県の支援を受けで起業したのがV-SYNC(ブイシンク)の前身となるV-SYNC テクノロジーです。私は会長で、社長が現在も続けている井部孝也さんです。この会社は2010年にインテルキャピタルに買収されています。
※日本セルモ:愛知県を本社とする博覧会用シミュレーター会社。テーマパークでシミュレーターライドが流行し、オランダ村「フューチャーシティ」(1993)や鈴鹿サーキット「バーチャルファクトリー」(1995)など様々なバーチャルライドを開発。2度の不渡りを出し、負債額8.5億円で1999年に倒産。
※ベッコアメ・インターネット:尾崎憲一が東芝在職中である1994年に開業した個人向けインターネット接続サービス。インターネットWIN、リムネットと並んで三大老舗ISPの一つ。わいせつ画像公然陳列容疑で1996年にはじめての警察の強制捜査、2004年にネット接続サービス・ホスティングをGMOインターネットに譲渡
――:ブイシンクではどんな仕事をするんですか?
岡山から光ファイバーで音楽や映像を非同期で送る研究開発ですね。大容量のデータがちゃんと伝送される状態って実はなかなか難しくて、いまとなってはHTTP/3(2022年導入)でQUIC等の普及が始まっていますが当時黎明期のインターネットの標準プロトコルであるTCP/IPはなんとなーくつながっている"状態なんですよ。つながってても届いてなかったり、届いててもACK(Positive Acknowledgement:受領確認)が戻ってこないとか、これでいいのか!と。
サーバーOSこそLinuxで普及していったけど、伝送プロトコルはNTTと政府も巻き込んでATMを始めとする光アクセスの日本規格を作ろうと色々やっていたんです・・・結局TCP/IPが主流になって失敗しちゃいましたね。
――:なんかエンジニアって「ソフトウェア作っている」イメージが強いんですけど、思ってみたら伝送とか著作権とかそういう部分にも入っていくんですね。
■音楽ストリーミング第一世代。敵を知り、己を知らば、百戦危うからずや
――:なるほど。新井さん、今AIについて経産省にモノ申したり(中山も先日同席させてもらいました)色々やっていますが、こうしたAdvocator(業界の提唱者)みたいな役割はよくやってきたんですか?
そうなんですよ。基本は一起業家、一企業の視点でビジネスをしてきたのですが、海外から規格が持ち込まれて日本としてそれに乗るのか独自のものを開発するのか、NTTなどの大企業や日本政府も巻き込んで喧々諤々やる、ということをLinux時代からやってきました。その次に伝送プロトコルの話があって、その後はストリーミングでの音楽著作権など。
――:音楽も手掛けられてたんですね!そちらはどうだったんですか?
悔しいけど「音楽もダメだった」という結論になるんです。当時はまだ“5大"メジャー時代(当時はユニバーサル、ソニー、ワーナーにEMI、BMG)で、日本レコード協会さん、音事協さんや音制連(JASRACは入っていないです)さんとご一緒に、ネット音楽配信のための著作隣接権を一括処理するような仕組みを考えてました。40億円も調達してかなり大掛かりな取り組みになっていたんですが、、、
――:ソニーもiPod以前でPDA端末とかやっていた時代ですよね。その後2010年代までストリーミングは“黒船"視されてましたし、音事協や音制連が容易にOKだせない印象ですが・・・
説得に奔走し、業界団体と5大メジャーほぼ全ての利害関係者がOKとなったのですが、レコード協会のトップの方だけが「俺の目の黒いうちは、そんな音楽文化破壊するようなことはさせない」とかで、隣接権の包括契約は進められませんでした。やっぱり業界全体の足並みが揃えられなかった。送信可能化権等の権利関係の整備は進みましたが、音楽配信市場自体はAppleを中心とする外資に奪われてしまいました。
ただ一歩進展したこととして45秒までなら視聴機で原盤権を全楽曲包括許諾にすることができたので音楽視聴機「リスニングポッド」は可能になったたんです。
――:だから当時のCDショップで無料視聴機がバンバン置かれるようになったんですね・・・!知らなかった。なにがあれば、当時やりたかったことが実現したのでしょうか?
「敵を知り、己を知らば百選危うからずや」ですよ。当時の僕はOSSコミュニティでOSSばっかりやっていた。もっと外に目をむけるべきでした。マイクロソフトのOfficeなんて使わない!と尖がっていて、MSがAppleが何を考えてどういうことをしようとしているかを見ていなかったんです。日本人はソフトのエンジニアとしても「職人性」が高すぎて、目先の技術改良にばかり目がいってしまう。戦時中に日本人のエンジニアがとにかく機体を軽くして速くして「零戦」みたいなすごい航空機作るんだけど、中長期的にみるとそれがサステイナブルでない、ということがよく起こります。
――:それは非常に同意です。ゲーム開発でも1980~90年代の日本人技術者は世界一でした。黎明期のキャッチアップははやいんだけど、物量勝負でチーム戦となると途端に弱くなる。
スーパーな技術者に任せてすごいものを生み出す力はあるんですよね。ただ米国は結果的に兵站まで考えて誰もが同じものをつくれる「プロセスづくり」がすごいんです。だからB29みたないものがバンバン作られて日本は敗戦していった。初速だけよい日本企業がいつもプラットフォーム時代に負け越してきたのは、ここ1世紀ずっと日本人の強み弱みを我々が自覚できていないところからきたのかもしれません。
■最先端のAI研究論文が数日で実装。1000倍速になったUpdate時代
――:AIはそもそもどうやって広がってきたんですか?
すべては1年半前です。Microsoftと提携したOpen AIのサム・アルトマンが有名ですが彼のChat GPTがリリースされた2022年11月。ただそれ以前にも画像AIとしてMidjourneyとStable Diffusionが2022年7月にサービスを開始し、ここから「生成AI画像」が急激に増えていきます。Stable Diffusionのエマド・モスターク氏がとんでもない人で、ガーンと(1.1億ドル)調達したら、そのまま全部開放しちゃって勝手に使え、と。それで爆発的にStable Diffusion使う人が増えて、ここでOSSコミュニティが爆発的に進化するんですよ。
ちなみにこのエマド氏はアルトマンやイーロン・マスクとガンガンにX上で喧嘩しているOSS原理主義者みたいな人なんです。
――:確かにここがポイントで最初イラストだったものが、2023年に入ってから「フォトリアル」でめちゃくちゃリアルなバーチャルアイドル的な図像が一気に増えました。
23年2月ですね。それまでアジア人は難しいといわれたのに「アジア人の美少女が出力可能」と言われるChilloutMixの登場で「リアル」でかつ「アニメタッチ」な合成美少女たちがバンバン作られるようになりました。
これだけ多くの人のエネルギーが「かわいい子がみたい」という一点の目的だけに作られていると思うと、その凄まじさに驚愕しますよ。現在の画像生成AIの基盤となっている階層マージ技術はChilloutMixやその基盤となっている画像モデルを生成するために開発されました。先にこんなものがつくりたいというのがあり、それを実現するために技術開発してきたのが今です。AiHUBはそうした中で、この階層マージ技術開発や基盤モデルを開発していた日本人OSSコミュニティが企業化した会社なんです。
――:僕も以前「初音ミク」のPVをつくってといったらあっという間にAIが作ってしまったみたいなやつも拝見しましたよ。
そうなんです。シリコンバレーや東アジアの企業がそうした既存IPの動画や静止画を著作権無視してバンバン作ってしまっている。AIで描けるからもう十分といって、イラストレーターを解雇してしまった企業もあったくらいです。
――:この約2年間で「AIはどこまで変わってしまうのか?」と様々な恐怖感をあおられるようになりました。そもそもAIブームは1960年代の第一次ブーム(自然言語処理で推理探索ができるようになった)、1980年代の第二次ブーム(機械学習で専門知をインプットできるようになった)もありましたが、2006年のディープラーニングと2018年GPTのトランスフォーマーモデルがSingurality(技術的特異点)となって確変的な変化を及ぼしてきました。
自然言語処理ですよね。その2018年GPT1モデルが出てから急激にトランスフォーマを利用したモデルが進化して、2022年11月にOpen AIのChat GPTがサービスを開放すると世界中で一気に使われるようになりました。
最初はアカデミックとオープンソースでスタートした生成AI開発ですが、その後2022年2月のDALLE2の頃は研究所でクローズに作られていたものなんですよ。それが突然2022年8月にStabilityがオープン化して、10月には静止画のイラストアニメモデルができあがった。23年2月になると「フォトリアルな女の子」ができるようになって、もう2023年半ばに入ったらそうした静止画の次元を飛び越えて「~を作って」といったらそのまま動画が飛び出してくるような時代になった。
――:まるでナップスターやWinnyのファイル共有ソフトですよ。みんな面白い面白いで共有しあって勝手に作って載せて、“祭り"のような状況が2023~24年にネット界隈で起きました。
「この絵を学習させて良いかどうか」というのは法律的には許されても、倫理的な問題や産業競争力、安全保障的にどうなのかという議論がおざなりになっているんです。こういう仕組みが議論されぬままにみんなが一気呵成に入り込んじゃっています。
――:これはなんでこんなに展開が天文学的なんでしょうか?
システムのアップデート自体もヤバイ状態なんですよ。普通は研究者の論文が出て、そこから民間が取り入れて、2~3年でサービスに実装されたりするものじゃないですか。いまってAIに関する論文が発表されるじゃないですか?そこから2-3日でOSSのプログラム実装が開発されてそのまま査読なしの状態でプラットフォームに実装されちゃうんですよ。
必ずしも研究者じゃなくても、デザイナーさんやクリエイターさんが最新の論文を実装したアプリケーションを使いこなせそのまま機能アップデートするようなことができるようになった。体感値、サービス実装スピードが1000倍速になったような感じです。
――:AIが人類にもたらすものはどんなものなのでしょうか?僕はこういうのをみているとマルクス&エンゲルスの「近代ブルジョワ社会は、自分が呼び出した地下の悪魔をもう使いこなせなくなった魔法使いに似ている」という言葉を思い出さざるをえません。
もちろんマイナスばかりじゃないですよ。学習曲線もあがるのは確かなんです。「ひたすらAI絵をやってたら絵が描けるようになってた話」で、大好きな水星の魔女の絵を「NovelAI」で毎日画像生成して組み合わせてせりふをつけるという作業をやっていたら(絵を描いたことのない素人が、2週間で70ページの漫画が出来上がっていた!)どんどんAI絵でおかしいところを修正しているうちに「自分でテキトーにキャラ・ポージングを手書きして、それをAIに描きなおしてもらう」が効率的であることに気づき、最終的に「AI絵加筆おじさん」が半年で立派な絵描きになっていた、みたいな事例もあります。
――:なるほど。「ヒトの学習スピードを上げる」という意味では有用なものなんですね。“海賊を増やす"のではなく、“クリエイターを育てる"限りにおいては生成AIは社会と調和していくと思います。
結局はバランスの問題ですよね。今のクローズなAIは生成と利用が解放されていても、学習段階が非公開であることの課題がでる。じゃあ最初からオープン化がよいかというとこれもこれで権利関係が怪しいものをバンバン読み込んでしまっていて問題が大きい。二元的な議論ではなく、現状のクローズな課題点をきちんと理解しつつ、どの部分だけオープンなものでメリットある部分を取り入れていくべきかという議論が大事なのです。
業界の好況インフラとして権利/分配関係がトレーサブルな仕組みを行政と一緒になって構築しつつ、生成段階・利用段階でもそれをマネジメントできる仕組みを残していく。
<クローズなAIの問題点>
<オープンなAIの問題点>
<理想:バランスのとれた用途に特化したAI>
――:直近で課題となっているのは、どういうところなのでしょうか?
BigTech企業の不明瞭なオプトイン/オプトアウトです。彼らって結局「学習モデルは非公開」なんですよ。そんなブラックボックスに「面白い絵ができるから」で既存の著作権でまもられた画像、動画、音楽などをどんどん投げ込んでいてよいのか。それらを“学習"させてできたモデル自体には一切タッチできないままに、クローズであることに異を唱えているのが我々なんです。
■Webローマ帝国時代の終焉。日本企業が「うまい負け方」をするために必要なこと
――:しかしOSSが1980年代からあり、しかも最近になってもOSSが主体で世界が変わっているとは思いもしませんでした。
おおもとは『伽藍とバザール』です。今もWeb3の人たちも参考にしているくらいの“聖典"で、OSSコミュニティの基礎になっているのって、エリック・レイモンド、『伽藍とバザール』(1990)、「ハロウィーン文章」(1998)なんですよね。
Open AIもコミュニティが会社化したものですし、先ほどの2022年末からの画像の天文学的な生成を主導したのもOSSコミュニティですし、結局今後はこうした「コミュニティづかい」が会社をつくったり、業界のオピニオンをひっぱっていく時代なのかもしれません。Open AIと同様に今回のAiHUBも同様に画像生成系コミュニティからできあがった会社です。
※Eric Raymond(エリック・レイモンド1957~)ボストン生まれ、ベネズエラ育ち。ペンシルバニア大学卒業後、1980年からプログラマーとして活躍するオープンソースのスポークスマンで、GNU/Linuxの開発手法を分析した『伽藍とバザール』をはじめ「オープンソース4部作」と呼ばれる書籍を執筆している。1998年にマイクロソフト(MS)のオープンソフトウェア(OSS)、特にLinuxに対する潜在的企業戦略を告発し、これがMS社の悪夢になりえる内容ということで「ハロウィーン文章」と呼ばれる。
――:日本にそういう「OSSコミュニティ」ってものすごい数がいるものなんですか?なんかWeb3のNFTエンジニアも実は数万人とかかなり数は限られていて、「クリプトの冬」でも全く関係なく純増している数字とかみて驚きましたが。
日本にはエンジニアが何十万人いますが、OSS開発の中心となるコアメンバーは数十人程度ですよ。いまGithubでJavaScriptのエンジニアは2500万人いますが、Web3をやってた人は0.2%とかです。
実際にみて遊んでいる人はいっぱいいても「創る人」ってのはホントに希少なんです。私の場合はそうした第一人者といえるコントリビューターたちと1to1の関係でつながっているのでこうしてAiHUBのような構想のもとに会社をスピーディに立ち上げられるんです。
――:昔のOSSと今のDAOって言っている人たちって何が違うんですか?
平たく言うと、昔はプログラマしかいませんでしたね。あくまでGithub上でプログラマ同士が協力しあっていた。でもWeb3文脈でDAOになると、マーケティングとかインフルエンサーとか必ずしもエンジニアじゃなくても貢献できるし、それぞれが“人権を得た"感じなんですよ。お役所の人もいるし、研究者もいるし、実は中学生ですみたいな人もいるんです。コントリビューター達が多様で、皆が興味ある分野で活動するようになったのはここ最近の変化ですね。
――:彼らにとっての不安・不満というのはどういうところにあるんでしょうか?個人的にWeb1.0時代のネットなんて危険ばかり。GAFAMが出てきたことである意味「安心してネットが使えるようになった」という感覚もあります。
GAFA帝国時代って我々からすると「ローマ帝国時代」みたいなものなんですよ。一つの法律がそれが世界であるかのような強制力をもっていて、まだネットが未分化な時代にあったよき多様性などが一時的に失われてしまった。
でも2021年ごろから始まったWeb3×AIのムーブメントはまさにローマ後期でちょっと帝国から離れても生きていけるんじゃないかという機運がでてきた。だからよき時代のOSSを知っている我々としては、今Web3にしてもAIにしても、いかにコミュニティドリブンな部分を取り入れて、またマイクロソフト一強みたいな時代になることを防ごうとしているんです。
――:これはまさにIBMのメインフレームやMicrosoftのOS/Officeモデルのときに新井さんたちが闘っていたようなことなのでしょうか?
はい、まさにそういうことでMS一強ではなく、そこにLinuxのようなオプション手段を設けておきたいんです。OSも検索もブラウザもみんなCentralなものになってしまって、「日本のデジタル敗戦」みたいに言われてきましたよね。このままだとAIやWeb3領域でも同じように数年後に敗戦が確定すると思っています。
――:これは逆にどういう世界を実現したいものなのでしょうか?
権利者・著作権者・製作者たちが中心となったバリューチェーンの確立です。アニメやキャラクターは日本のエンタメ業界の資産で、それを無作為にAIモデルと接合せずに自分たちで基盤モデルをつくっていきたいんです。こちらは弊社CMOのくりえみさんですが、ご自身の写真をAIに数十枚読み込ませるだけでこれだけ多くの服装バラエティで画像生成できました。弊社のLoRAを使っての実験的な試みで、ここを経由すればトレーサブルな画像になるので海賊版でどんどん使われたとしても「たどれる」ものになります。こうやって、「偽物が反映する前に、本物が海賊版を駆逐する世界」を実現したいんです。こうした動きは民間の個社ごとでは到底難しいので政官民が一体となって連携する必要があるんです。
――:でもいまさら「AI後進国」の日本に勝ち筋があるものなのでしょうか?2018年時点のAI関連投資でいうと中国4兆円で1か国で世界の3/4も占めています。AIベンチャーの資金調達でも中国48%、米国38%で日本は数%にも満たせません。
全体論としては米国もしくは中国に対してはすべての国が「惨敗」ですよ。AIのプラットフォームもプロトコルも米国主軸のものが覇権を握ることは確定しています。
でもここに対して例えば「アニメチェーン」みたいな日本コンテンツとひもづけたものは逆に日本にしかできない。そういう局地戦でライバルのいないところで自分たちの得意な領域を開拓し、今の高付加価値な部品メーカーのような立ち位置をAI領域でも日本がとれる可能性はあります。
――:具体的に政府ができることってどういうことなのでしょうか?
残念ながら現在は、政府の支援はLLM(大規模言語系)とデータセンターの整備に偏っています。AIの進化はまだ始まったばかりです。これからはAGI(汎用人工知能)にむけてマルチモーダル(映像、音、声、3Dデータetc)なAIの開発競争が激化していきます。また、AIはプログラムだけでなく、ワークフローやモデルデータ等が複雑に絡み合って動作するために、AIオーケストレーションという技術開発が大事になります。
――:なるほど、LLMってまだまだ“これから大量に始まる生成AI経済圏の一部"みたいなものなんですね。
マルチモーダルなAGIの開発競争は始まったばかりで、ジャパンコンテンツを基盤にしたAIを世界のスタンダードにするチャンスはあります。AiHUBでとりくんでいる、マルチモーダルAGIやAIオーケストレーション等のディープテック技術分野は、従来のアカデミックな研究者やエンジニアだけではなく、感性の領域のクリエイターさんと一緒に基盤技術とユースケースを一体に開発していく必要があります。日本のOSSコミュニティ主導で開発・普及されグローバルで普及している階層マージ技術が代表例です。政府には、大規模言語系やアカデミックな研究開発支援だけでなく、民主的なAIを実現するOSSの支援、次世代のマルチモーダルなAGIの基盤開発を積極的に支援してもらいたいと思います。
それにともなって、クリエイターさんへの配慮や、権利関係の整理が大事になってきます。例えば、クールジャパンの代表例となるアニメ/マンガ業界のDX支援でしょうね。アナログから、AIに一気に以降するのではなく、アナログ→デジタル→3Dセルルック→AIといった段階的で着実な移行が重要となります。
持続可能性のある民主的なマルチモーダルAGIの開発のために、クリエイターさん主導の標準的なプロセスを整備する調査費用を出したり、ルール作りをしていく。業界団体の設立の音頭をとったり、ことによってはとにかくAIはデータ計算機の資源がかかる。ここは資金支援をしないとベンチャー企業のR&D予算ではとても出せない。OSSづくりを支援したり、ブロックチェーンでのトレーサビリティを担保したり。やるべきことは山ほどあります。
――:今我々が気づいていない「分岐点」を新井さんは多くみているような気がします。改めて今の現状の整理と、政府・官僚・そして各企業がどういう姿勢で臨むべきでしょうか?
これからの日本にとって、独占的なAIだけではなく、民主的で持続可能なAI開発が重要となります。いままでの産業と違い、一度、データが独占的なAIに取り込まれると取返しのつかないことになります。国際競争力、産業保護振興の観点からインターネットに公開されない各産業ドメイン独自の内部データを活用したAIの重要性が高まってきます。
カーボンニュートラルと同様に、B/S、P/L、ROIといった経済合理性だけではなく産業基盤、社会資本としてのOSSやAIを日本発で開発、普及させるための最後のチャンスだと思います。民間だけでは難しい部分も多いです。政・官・民一体となった取り組みが重要です。既存の枠組みにとらわれない、大胆な発想の転換が必要になります。
会社情報
- 会社名
- Re entertainment
- 設立
- 2021年7月
- 代表者
- 中山淳雄
- 直近業績
- エンタメ社会学者の中山淳雄氏が海外&事業家&研究者として追求してきた経験をもとに“エンターテイメントの再現性追求”を支援するコンサルティング事業を展開している。
- 上場区分
- 未上場