技術資料

Feel&Think

第11回 生成AI(Generative AI)

担当:岩永 昇二
2024.06

前回の「地層科学分野でのAI活用事例(トンネル編)」では、AIの活用事例として既存の論文の整理を行い体系的にまとめ、現在の建設業界におけるデジタル革命と合わせて紹介しました。

今回は、以前紹介した内容と最新の情報を踏まえ、「生成AI」に関するさまざまな側面を紹介していきます。

概要

生成AI(Generative AI)とは、その名の通り、今までの識別系AIとは能力が異なり、言語だけでなく、画像、動画、音楽など様々なものを生成することができます。そのクオリティは、1年前とは比べ物にならないほど向上しており、さらに進化し続けています。このような技術がどのようにビジネスで活用できるかについて、現在多くの企業が調査・研究を進めています。既に先行してビジネス展開している企業もあり、この状況はインターネットが普及したとき以上のインパクトがあるともいわれています。

生成AI

生成AIにはいくつかの種類があります。例えば、文章生成AI、画像生成AI、動画生成AI、3Dモデル生成AIなどです。これらのAIがどのような製品やサービスに応用されているか、それぞれについて調査してみました。

■文章生成AI

文章生成AIは、自然言語処理技術(NLP:Natural Language Processing)と深層学習の技術を利用して、入力された情報に基づいて文章を自動的に生成するシステムです。主な応用例として、コンテンツの作成、チャットボット、翻訳、教育、クリエイティブライティングなどに使用することができます。

2022年11月にOpenAIのChatGPTが公開され、その性能の高さから、世間の注目を集めました。以下は現在まで公開された文章生成AIのリストです。表中のマルチモーダル化とは、異なる形式のデータ(例:テキスト、画像、音声、センサー情報など)を組み合わせることを言います(日付は、最新のリリースを示します(2024年6月時点))。

日付名称LLM開発元マルチモーダル化備考
2022年11月ChatGPTGPT-3.5-turboOpenAIパラメータ数: 175B(96層)
2023年2月BardLaMDAGoogleパラメータ数: 137B
2023年3月ChatGPTGPT 4.0OpenAIパラメータ数: 非公表
2023年3月ClaudeClaudeAnthropic
2023年4月BardPaLMGoogleパラメータ数: 540B
2023年5月BardPaLM2Googleパラメータ数: 非公表
2023年5月Bing ChatMegatron-Turing NLGMicrosoft
2023年7月Claude 2Claude 2Anthropic
2023年11月ChatGPTGPT-4 TurboOpenAIパラメータ数: 非公表
2023年12月GeminiGeminiGoogleBardの後継モデル
2023年6月Microsoft CopilotGPT-3 CodexMicrosoftコード生成に特化した大規模言語モデル
2024年4月Claude 3Claude 3Anthropic
2024年5月ChatGPTGPT-4 o(omni)OpenAI

■画像生成AI

画像生成AIは、人工知能の一種である深層学習を用いて、画像を自動的に生成する技術です。大量の画像データを学習することで、画像の特徴やパターンを理解し、人間が描いたかのようなオリジナルの画像を作成します。主な応用例として、イラスト・画像作成、画像編集、画像修復、画像のリアリティ向上、商品画像の作成などがあります。

2022年8月にStability AIのStable Diffusionがオープンソースとして公開され、商用利用も可能ということから、世間の注目を集めました。以下は現在まで公開された画像生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。

日付名称開発元備考
2022年4月DALL·E 2OpenAIテキストから画像生成AI、招待制
2022年7月MidjourneyMidjourneyテキストから画像生成AI
2022年8月Stable DiffusionStability AIオープンソースの画像生成AI
2023年1月OpenJourneyOSSMidjourneyをオープンソースで再現
2023年3月Adobe FireflyAdobePhotoshop内の画像生成AI
2023年7月SD XLStability AIStable Diffusionの後継
2023年9月DALL·E 3OpenAIChatGPTやBing Image Creatorで画像生成可能
2023年10月Firefly Image 2AdobeAdobe Fireflyの後継
2024年3月PIXART-ΣHuaweiのNoah’s Ark Labと中国の複数の大学の研究者テキスト→4K画像生成
2024年4月Emi 2AI Picasso社AIアートの生成に特化した画像生成
2024年4月Firefly Image 3 FoundationAdobe画像生成
2024年4月EvoSDXL-JPSakana AI日本語に特化した画像生成
2024年6月Flash DiffusionJasper AI, INC.テキスト→高速画像出力AI手法
2024年6月Stable Diffusion 3 MediumStability AI画像生成AIモデル

■音楽生成AI

音楽生成AIは、人工知能を用いて、自動的に音楽を生成する技術です。大量の音楽データを学習することで、音楽理論や作曲技法を理解し、人間が作曲したかのようなオリジナルの楽曲を生成しまう。主な応用例として、作曲支援、サウンドトラック生成、音楽教育、パーソナライズド音楽などがあります。

以下は現在まで公開された音楽生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。

日付名称開発元備考
2016年AIVAAIVA TechnologiesAIによる作曲ソフトウェア
2020年3月JukeboxOpenAI音楽生成
2020年9月SoundrawSOUNDRAW株式会社AIによる音源生成サービス
2023年6月MusicGenMetaオープンソース、デモ版公開
2023年8月MusicLMGoogle音楽生成AI言語モデル
2023年8月Audio CraftMetaオープンソース、デモ版公開
2023年9月Stable AudioStability AI音声/音楽生成AI
2023年11月LyriaGoogle DeepMind音楽生成モデル
2023年11月Music ControlNetカーネギーメロン大学とAdobe Researchの研究チーム音楽生成制御AI
2024年3月SonautoSonautoボーカル入り楽曲生成
2024年4月Stable Audio 2.0Stability AIStable Audioの新版
2024年4月udioテキストから高品質な音楽生成
2024年4月SunoSuno AIプライベート企業による音楽生成AI
2024年5月Music AI SandboxGoogle音楽生成AIツールキット
2024年6月Stable Audio OpenStable Diffusionオープンソースの音楽生成AI
AI Jukeboxブラウザだけで動く音楽生成

■動画生成AI

動画生成AIは、人工知能を用いて動画を自動的に生成する技術です。テキストや画像などの情報を基に、AIが映像や音声を組み合わせて新たな動画を作成します。従来の動画制作のように、撮影や編集を人が行う必要はなく、短時間でかつ低コストで動画を制作することができます。主な応用例として、映画・アニメ制作、広告制作、ゲーム開発、教育・トレーニング、医療バイオインフォマティクスなどがあります。

以下は現在まで公開された動画生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。

日付名称開発元備考
2018年9月Video BRAIN株式会社オープンエイトAIビデオ編集ツール
2020年7月Pictorypictory.aiテキストから画像生成モデル
2023年GliaCloudGliaCloudゲームAIクラウドサービス
2023年3月Runway Gen-2Runwayテキストから画像生成モデル
InVideoWhitesheep Technology Private Limitedオンライン動画編集ツール
KaiBerKaiberAIアバター生成ツール
Steve AIAnthropicAIビデオホスト
Elaielai.aiAIコンテンツ作成プラットフォーム
2023年1月Deep AI Movie CreatorクリスタルメソッドAI映画制作ツール
2023年6月FlexClipPearlMountainオンライン動画作成ツール
2023年10月CanvaCanva画像・デザイン作成ツールでMagic Mediaで動画生成
2023年11月Pika 1.0ジェネレーティブ AI 映画会社の Pika LabsAIビデオ編集ツール
2023年12月Kn1ghtQrow Pte. Ltd.AIアニメアバター生成ツール
2024年Lumen5Lumen5動画作成プラットフォーム
2024年1月LUMIEREGoogleAI映像生成モデル
2024年2月Stable Video DiffisionStability AIテキストから動画生成AI
2024年2月SoraOpenAIテキストから動画生成AI
2024年4月VidsGoogleビジネス系動画生成
2024年4月PixversePixverse動画生成
2024年5月VeoGoogle動画生成
2024年5月VivaHiDream.aiテキスト・画像→高画質動画生成
2024年5月EMOPortraits画像→表情豊かなヘッドアバター動画生成
2024年5月StoryDiffusion中国のByteDanceと南開大学の研究チームストーリー性のある長尺画像・動画生成
2024年5月Vidu中国のShengshu Technologyと清華大学が共同開発動画生成
2024年5月SynthesiaSynthesia Limited表情豊かなしゃべるAIアバター生成ツール
2024年5月VASA-1Microsoft人物画像と音声→しゃべるアバター動画生成
2024年6月Dream MachineLuma AIAI映像生成プラットフォーム
2024年6月可灵(Kling)快手(Kuaishou)ジェネレーティブAIプラットフォーム
Noisee AINoisee AIサウンド付きの動画生成
2024年Mootion StorytellerHK Mootion Limitedストーリー動画生成
Digen人物がしゃべるリアル動画生成

■3Dモデル生成AI

3Dモデル生成AIは、人工知能を用いて3Dモデルを自動的に生成する技術です。画像やテキストなどの情報を基に、AIが形状や質感、色などを分析し、3Dモデルを作成します。従来の3Dモデリングではソフトを使って手作業でモデリングする必要がありましたが、この技術を使えば短時間で簡単に3Dモデルを作成することができます。主な応用例として、ゲーム開発、建築設計、医療、エンターテインメントなどがあります。

以下は現在まで公開された3Dモデル生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。

日付名称開発元備考
MiragemlMirage ML Inc.ポリシーベースのAIモデル
Meshery画像やテキストから3Dモデルを生成
Dream Gaussian画像やテキストから3Dモデルを生成
2021年12月HyperNeRFGoogle高画質な3Dモデルを生成
2023年3月GENIELuma AI画像やテキストから3Dモデルを生成
2023年5月Shap-EOpenAI
2023年11月Cube by CSM1枚の画像から3Dモデルを生成
2023年12月Doodle Your 3D
ShapeLab画像から3Dモデルを生成
Ganeratorテキストから3Dモデルを生成
2024年3月Adobe Substance 3DAdobe汎用AI生成モデル、Adobe Firefly 生成AIを統合
2024年4月InstantMesh中国のテンセント画像→3Dモデル高速生成
2024年5月Unique3D画像→高品質な3Dモデル生成
2024年5月Meshy-3Meshy LLCテキスト・画像→3Dモデル生成
2024年6月Project NeoAdobe3Dコンテンツ生成

生成AI活用

各生成AI分野でさまざまなサービスやモデルが開発されています。この傾向は今後も続くと考えられます。これらの生成AI技術をうまく活用することが、企業の発展にとって極めて重要な要素となっています。この技術は、データ解析、顧客サービス、マーケティング戦略の策定など、さまざまなプロセスに革新をもたらします。しかし、生成AIを効果的に活用するためには、単なる技術導入だけでなく、経営層の深い理解と積極的な関与が不可欠です。

生成AIとは、大規模なデータセットを用いて新しいデータやコンテンツを生成する技術です。前述したサービスやモデルを使用することで、例えば、チャットボットやバーチャルアシスタントは、自然言語処理技術を活用して顧客対応を自動化し、効率化することができます。また、画像生成技術は、広告やデザインの分野で新しいクリエイティブを生み出す手助けとなります。

生成AIの導入には、経営層がそのメリットとリスクを正確に評価することが求められます。AI技術は正しく利用すれば大きな利益をもたらしますが、不適切な運用や倫理的な問題が発生する可能性もあります。例えば、データプライバシーの問題やバイアスのあるアルゴリズムの使用は、企業の信頼性を損なうリスクがあります。経営層は、これらのリスクを理解し、適切なガバナンスとコンプライアンスの枠組みを構築する必要があります。

さらに、生成AIの効果的な活用には、経営層のリーダーシップが重要です。経営層がAIプロジェクトを主導し、会社的な支援を確保することで、技術の導入の成功率が高まります。具体的には、AIに関するビジョンを明確にし、社内のステークホルダーと共有することが求められます。また、適切なリソースの配分やスキル開発の支援を行うことで、従業員が生成AI技術を効果的に活用できる環境を整備することも重要です。

調査結果によると、生成AIの成功には経営層の積極的な関与が不可欠であることが示されています。具体的な事例として、ある企業では、経営層が生成AIの導入を主導し、社内の教育プログラムを通じて従業員のスキル向上を図った結果、生産性が大幅に向上したと報告されています。また、別の企業では、経営層が生成AIの倫理的使用に関するガイドラインを策定し、透明性を確保することで、顧客からの信頼を得ました。

結論として、生成AIの導入は企業の競争力を高める大きなポテンシャルを秘めていますが、その成功には経営層の理解と積極的な関与が欠かせません。経営層が生成AIの技術的側面だけでなく、その戦略的な重要性を理解し、全社的な取り組みを進めることで、生成AIの真の価値を引き出すことができるのではないでしょうか。

今回紹介した生成AIのサービスは、無料で使用できるものもあります。是非この機会に生成AIを実際に体験してみてください。

第12回は、強化学習の基礎である「マルコフ決定過程、ベルマン方程式、動的計画法、 モンテカルロ法など」について詳しく紹介していきます。


参考資料
1)Adobe Blog「生成AI最前線:生成AIシーンのリーダーが伝える”企業がいま取り組むべきこと“|Adobe Firefly Meetup#1」Yuji Sakai 04-15-2024
2)YouTube AI大学【AI&ChatGPT最新情報】
3)PwCコンサルティング合同会社「生成AIに関する実態調査2024春-試行錯誤の中で見え始める二極化の兆し:生成AIを経営資源の1つとする変革の始まり」(2024-06-17)
※上記参考資料の最終参照日は2024年6月

ページの先頭にもどる