CDLのCTO兼CDOである私、ウオリック・マセウスは、このほどAIとビジネスの世界的な権威であるアナスタシア・ラウターバッハ博士と対談し、AI分野の最近の動向と発展、そして日本の企業、政府、社会がAI革命からどのような恩恵を受けるかについて議論した。
本記事は、これらのトピックを探求し、潜在的に混乱しかねないこの重要な分野におけるラウターバッハ博士のアドバイスを紹介するシリーズ、第1回目である。
|
アナスタシア・ラウターバッハ博士 ベルリンにある大学の人工知能、データおよびデータ倫理の教授であり、起業家、テクノロジー戦略家でもある。また、国際的な社外取締役であり、英国、ドイツ、ロシア、米国の上場・非上場企業の監督・諮問委員を務める。 2024年には、ダブリンのBusiness Excellence Institute(ビジネス卓越性研究所)によってグローバル・ビジネス卓越性の殿堂に迎えられる。 言語学の博士号を持ち、ダイムラー、Tモバイル、ドイチェ・テレコム、クアルコム、マッキンゼーなどフォーチュン500企業やテクノロジースタートアップで32年間にわたり活躍してきた。 技術者以外の人々、特に若者にAIリテラシーを提供することを目的とした会社、AI Edutainmentの創設者でもある。現在、 スイスのルツェルンを拠点に活動。 URL: www.aiedutainment.ai |
3つあります:
まず、私が設立した「AIエデュテインメント(AI Edutainment)」は、AIリテラシーを向上させるための会社で、スイスのルツェルンに拠点を置いています。 私たちの使命とコミットメントは、AI、ロボット工学、量子テクノロジーに関する知識を世界中の100万世帯に届けることです。 私たちは、ソーシャルメディアを通じて、AIをわかりやすく説明したコンテンツを配信しています。 実際、私の物語や関連資料を読んだ大人や子どもたちは、ヨーロッパのCIOやAI担当者の大半よりも、このテーマを理解するのに適した能力を身につけることになると思います。
2つ目は、ヨーロッパのいくつかの大学で経営倫理も教えています。大学の講義は、さまざまな聴衆を相手に物事を試すのに最適な場所です。 指導を依頼されることが多いので、どの学部と一緒に仕事をするかは慎重に選んでいます。
3つ目の分野は、私は現在もコーポレート・ガバナンスの分野でかなり多くの仕事をしており、大企業の諮問委員会や監督委員会の委員を務めています。 私はこれまでに数多くの優れたガバナンスを目にしてきましたが、それ以上に問題のある、あるいは劣悪なガバナンスの事例を多く目の当たりにしてきました。 。私はドイツの「アプライド・ガバナンス」という非常に著名なグループのメンバーであり、ドイツのガバナンス・システムの改革に取り組んでいます。
まず理解しなければならないのは、社会的に大きな注目を集めているほとんどが大規模言語モデル(LLM)を中心としたもので、それがAIの世界のすべてではないという点です。
最近の画期的な進歩やAIの台頭をめぐる騒ぎを見る限り、そのルーツが1940年代、50年代、60年代の技術にあることを理解することは非常に重要です。
もちろん、2017年に発表されたGoogleの重要な論文「Attentions is All You Need(注意こそが必要とされる全てだ)」により、トランスフォーマー・アーキテクチャが登場し、その後のAI技術の発展に大きな影響を与えました。また、「生成AI(Generative AI)」という概念は、現在の意味で初めて使われたのが2014年でした。その後のトランスフォーマーモデルの発展とともに、生成AIが広く普及していきました。しかし、AIの基盤技術は実は古く、このLLMベースの技術はいくつかの課題を抱えています。
まず1つ目は、AI企業が現在主張していることとは裏腹に、この技術は間違いや「幻覚」を犯し続けるということです。例を挙げてみましょう:私は外傷外科医と結婚しています。 ChatGPT3が登場した直後の2020年12月に、キッチンで手術を行うことについてChatGPT3に質問したところ、ChatGPT3は、クリスマスの時期には焼きたてのクッキーの香りが患者を落ち着かせ、眠らせるのに役立つ、というアドバイスをしてくれました。 明らかに完全な誤りであり、これは大きな「幻覚」による結果でした。もちろん、夫は専門家なのでこの誤りに気づき問題はなかったのですが、もしその領域を知らずに知識を得るためにLLMを利用していたとしたら、深刻な問題が起こっていたかもしれません。
ではなぜ幻覚が起こるのでしょうか? 複雑ですが、根本的にはそれらのモデルは数学でいう「分布シフト」と呼ぶものをマスターしていないからです。簡単な言葉で説明すると、ディープラーニングモデルで言えば、それらのニューラルネットワーク技術は、「点と雲」の組み合わせのような、多重多層の相互作用に基づいて構成されているのです。
環境が明確で、データが整理されていて、それを処理するための計算資源が十分に確保されている場合、AIは素晴らしい成果を生み出します。例えば、AIはX線画像の異常を検出し、がんを特定することができます。そして、人間の医師よりも優れた精度で診断できることもあります。これは、大量のデータを用いて特定の課題に対する答えを導き出すAIの特性によるものです。
特定の質問から離れて、より広範な領域へと探求を広げると、AIは「幻覚」を起こすことがあります。これは、AIが学習する仕組みや、AI全般が持つ限界に関係しています。特に、AIは真の意味での「推論」や「理解」を持っていないため、学習したデータの範囲を超えた問題に直面すると、誤った答えを出すことがあるのです。この「分布の変化」に適応できないことが、AIの課題の一つとなっています。
率直に言えば、LLMは、基本的に統計的に生成される「トークンの流れ」です。LLMにとって、トークンとは単語そのものや単語の一部、さらには音である場合もあります。例えば、2021年には「トークンストリーム」に基づくモデルが「ベートーヴェンの交響曲第10番」を完成させました。
これらのモデルの内部で行われているのは、いわゆる「シンセティックス(合成データ)」の生成です。これは生成AIの一般的な仕組みであり、まず現実世界のデータを入力し、それをもとに新しい合成データが作り出されます。そして、多くのAI企業や、AIを活用する従来の企業は、この合成データを使って技術を訓練しています。
しかし、今日の時点では、この合成データが持つ本当の性質や振る舞いについては、まだ十分に解明されているとは言えません。私は統計学者ではありませんが、統計の専門家の友人たちも同じような懸念を抱いているようです。
ベートーヴェンの第十交響曲に関して言えば、これは音楽なので、私たちに直接的な影響を与えることはありません。もちろん、生成された作品の出来栄えについて「平坦だ」とか「感動が足りない」といった議論はできるでしょう。しかし、医療試験や、研究・重要なデータの評価に関わる場合は、話が変わります。こうした分野では、判断を誤ると重大な影響を及ぼす可能性があるため、リスクが格段に高くなります。このような状況でAIを活用する場合、果たしてそのリスクを受け入れるべきなのか、慎重な議論が求められます。
同じような話になりますが、LLMは決してAGI(汎用人工知能)を実現するものではありません。一部のLLMを開発している米国企業は、莫大な資金を投じてAGIの可能性を主張していますが、正直なところ、それらの投資が回収されるとは思えません。もし賭けるとしたら、大切な愛猫を賭けてもいいくらいです(笑)。つまり、投じられた資金と、そこから得られる成果のバランスは取れていないということですね。
LLMは、その流暢さによって私たちを魅了します。しかし、単にプロンプトを与えるだけでは、本当の価値を引き出すことはできません。重要なのは、「何をプロンプトとして入力するのか」「何を尋ね、何を求めているのか」を理解することです。
私は、このパブロ・ピカソの名言が好きです。「機械は愚かだ。ただ答えを出すだけだ。」
本質的な問題は、「問いを立てること」つまり、「どんな質問をすべきかを知ること」にあるのです。
私が多くの企業の前でAIの導入について話すとき、対象はLLMだけでなく、AI全般にわたります。例えば、単純なベイジアンネットワーク(データの因果関係を分析する手法の一つ)や線形回帰のような手法であっても、多くの企業にとって素晴らしい成果をもたらすことができます。
私は常に、企業が「戦略」「実行」「人材」という魔法の三角形の中を進んでいるのだと伝えています。戦略とは、競争に対してどのように対応するのかを決めること。AIをどのように活用するかを考える際には、この三角形のバランスを意識することが重要になります。
AI実装の "魔法の三角形"
まず最初のポイントは「戦略」です。どのように競争するのか?何があなたのビジネスを動かしているのか?これを明確にするために、リストを作成すると良いでしょう。
次に「実行」、つまり「どのように進めるのか」が重要です。これはIT環境に大きく左右されます。例えば、私が愛情を込めて「ヴィンテージ・アーキテクチャ」と呼ぶような、20〜30年前に構築されたシステムを使用している場合、新しいテクノロジーを導入するのは難しいかもしれません。一方、シリコンバレーで生まれた新しい企業は、最新のハードウェアを活用できるため、まったく異なる状況に置かれています。
最後のポイントは「人材」です。ここで重要なのは、自社の社員だけでなく、どのベンダーやアドバイザーと協力するかという点です。私がすべての経営者に伝えたい基本ルールがあります。それは、「AIを売り込む企業において、データサイエンティストよりも営業やマーケティング担当者が多い場合、その企業と提携する際は慎重になるべき」ということです。AIの本質は技術にあるため、その企業が本当に信頼できるかどうかを見極めることが必要です。
私がCISO(最高情報セキュリティ責任者)やCIO(最高情報責任者)のメンターを務めるのは、技術者が一般の人々—例えば経営層—に対して、分かりやすい言葉で説明できるようになってほしいと考えているからです。技術の専門家は内向的な傾向があることが多く、自分の考えを明確に伝えるのに苦労することがあります。そのため、非技術系の人々が複雑なテーマを理解するためには、「物語」のような形で説明することがとても効果的なのです。
私が経営層や取締役会にアドバイスをするとき、必ず伝えていることがあります。それは、「優秀な技術者を取締役会に迎え入れる必要はない」ということです。むしろ、必要な分野ごとに機能的で実践的な「アドバイザリーボード」を設置することが重要です。
例えば、サイバーセキュリティやインフラが課題である場合、本当に実務経験があり、実際に成果を上げてきた人を探すべきです。大手コンサルティング企業のスライド資料を持っている人ではなく、実際にデジタル変革を成功させた経験を持つ人とつながり、その知見から学ぶことが大切なのです。
デジタル変革は長く厳しいプロセスであり、私たちは冗談で「涙の道」と呼ぶこともあります。これは、一度の大規模な改革を行い、その後に祝賀会を開くようなものではないからです。もし競争力を高めるために非構造化データを活用する必要があるなら、それは単なる最新のAIモデルを導入するだけではなく、ITアーキテクチャ全体の要件となります。
古くからあるジョークに、「SAPのようなERPシステムの導入にはどれくらいの時間がかかる?」というものがあります。答えは「CIOが3人交代するまで」です。AIの導入がここまで時間がかかることはないと期待したいところですが、成功するAI活用の前には、徹底したデジタル変革が必要であるという点を決して軽視してはいけません。
私の考えでは、すべての企業には「データの影(Data Shadow)」が存在します。そして、このデジタルな影こそが、農業、医療、銀行など、あらゆる業界の企業価値を支えています。しかし、この価値を現実世界で発揮するためには、まず投資が必要です。失敗を恐れるあまり、挑戦を避けていては成功することはできません。リスクを取り、勇気を持ち、失敗から学ぶことが重要なのです。
経験則として、本当にAIに特化した企業であれば、収益の25%をクラウドに投資しています。これは、専用のシステムを持たず、GPUを活用したクラウドシステムを利用しているためです。そして、収益の15%以上をデータのクレンジングに費やすことが、優れた企業の最低条件と言えるでしょう。データを適切に整理せずに、ただ手元にあるデータを使うだけでは、有用なAIモデルを構築することはできません。
とはいえ、これは決して簡単なことではありません。時にはひとつひとつのファイルをチェックし、アルゴリズムを使ってデータをクラスタリングし、何が含まれているかを理解するという地道な作業が必要になります。そして、それを繰り返し行い、データを整理し続けることが、最終的にはAIの成功へとつながるのです。
正直なところ、「Deep Seek」に関する6百万ドルという数字は誤解を招きかねません。この金額は、「Deep Seek V3」や「R1」モデルの単一のトレーニング実行にかかる計算コストを指しており、その際に使用されるのは2,048基のNvidia H800 GPUです。これは、中国市場向けに設計されたNvidia H100のバージョンであり、中国では米国で開発された最新のAI向けハードウェアにアクセスできない事情があります。
しかし、この6百万ドルは、複数回のトレーニングや失敗した試行のコストを含んでいません。その試行回数がどれほどだったのかは不明であり、確かな数字はわかりません。
このコストには、データの収集、クレンジング、キュレーションが含まれていません。これらは、どの企業にとっても不可欠なスキルです。また、研究開発の費用も含まれていません。
例えば、私はDeep Seekの一部の技術に、2015年にユルゲン・シュミッドフーバー(Jürgen Schmidhuber)が発表した論文の研究が活用されていることを発見しました。彼は世界的に優れたコンピューター科学者のひとりですが、米国ではジェフリー・ヒントン(Geoffrey Hinton)やヨシュア・ベンジオ(Yoshua Bengio)ほどの評価を受けていません。それでも、彼は**長短期記憶(LSTM)**の生みの親であり、この技術は現在、世界中のスマートフォンやさまざまなシステムに活用されています。
さらに、この6百万ドルのコストには、研究者やエンジニア、サポートスタッフの人件費も含まれていません。また、ハードウェアの購入、保守、インフラの維持などのコストも考慮されていないのです。
まず、日本語という言語の特性や、日本独自の文化が重要になります。現状、日本向けに設計されたLLMは存在していません。しかし、日本には十分な規模があり、本格的な日本専用モデルを開発する価値があると思います。
そのためには、日本の持つ文化的なニュアンスを含めた膨大なデータが必要になります。さらに、規制や技術的な知的財産など、標準的な要素も考慮する必要があります。
例えば、私はシリコンバレーに拠点を置くディープテック企業と協力しています。この企業は、無線アクセスネットワークの再構築を行っており、半導体業界のベテランたちによって設立されました。ハードウェアとソフトウェアの専門知識を活かし、アンテナ技術などを含む高度な技術に取り組んでいます。そして彼らは、自社の専門分野に特化したLLMを構築し、オペレーター向けの分析やサマリー作成、提案、さらにはコミュニケーションのために活用しています。
このように、日本を単なる適応の対象ではなく、一つの専門領域として捉えることで、日本専用のAIを開発する可能性は十分にあるのです。単にシリコンバレーで訓練された英語モデルを日本文化に適応させるだけではなく、本当に日本に根ざしたAIを作ることが、より意義のある取り組みになるでしょう。
最も基本的なスキルは、まずデータが戦略にどのように関係しているかを理解することです。そして次に重要なのは、そのデータがどこに存在するのかを把握することです。
データウェアハウス?データレイク?ハイブリッド型の環境? どのような形でデータを管理しているのかを明確にしなければなりません。
次に、そのデータにアクセスするのは誰か?誰が使用しているのか? そして、あなたのビジネスにおける「データ」とは何か? ファイルなのか?データベースのレコードなのか?
例えば、私は取締役会でサイバーセキュリティについてアドバイスをするとき、彼らにこう尋ねることがあります。 「あなたの企業が円滑に運営されるためには、何枚のファイルが必要か把握していますか?」
データの重要性を理解することが、適切な管理と活用への第一歩となります。
この問いへの答え方は、多くのことを示しています。これは非常に戦略的な質問です。もし、あなたの企業がスリムで機敏な運営を目指すのであれば、まず自社の「データの宝」を見極めることが必要です。最近では体のデトックスが流行していますが、同じように企業のシステムも整理・最適化する必要があるかもしれません。デトックスを成功させるためには、まず「最も重要な資産」がどこにあるのかを理解することが欠かせません。
まず、社内の関係者と話し合い、システムを詳細に見直し、その「重要な資産」を特定しましょう。そして、その価値を最大限に引き出すために、専門家と協力し、製品を改善し、新たな外部チャネルやパートナーシップの機会を生み出す方法を検討することが重要です。
「AmazonやGoogleはAIのためのデータを持っているが、私たちにはない」という声をよく耳にします。しかし、実際には自社にもデータはあり、競合企業もデータを持っています。このデータを有効に活用するために、「データトラスト」を構築し、集約されたデータ量を増やす方法を考えることが可能です。これは企業の機密情報を公開するという話ではなく、各社の価値提案(バリュープロポジション)をさらに発展させるための取り組みなのです。
[今後、データの民主化とデータ共有のベストプラクティスに関する記事を掲載する予定です。]
Copyright Compliance Data Lab, Ltd. All rights reserved.
掲載内容の無断転載を禁じます。