技術資料

Feel＆Think

第11回　生成AI（Generative AI）

担当：岩永　昇二

2024.06

前回の「地層科学分野でのAI活用事例（トンネル編）」では、AIの活用事例として既存の論文の整理を行い体系的にまとめ、現在の建設業界におけるデジタル革命と合わせて紹介しました。

今回は、以前紹介した内容と最新の情報を踏まえ、「生成AI」に関するさまざまな側面を紹介していきます。

概要

生成AI（Generative AI)とは、その名の通り、今までの識別系AIとは能力が異なり、言語だけでなく、画像、動画、音楽など様々なものを生成することができます。そのクオリティは、１年前とは比べ物にならないほど向上しており、さらに進化し続けています。このような技術がどのようにビジネスで活用できるかについて、現在多くの企業が調査・研究を進めています。既に先行してビジネス展開している企業もあり、この状況はインターネットが普及したとき以上のインパクトがあるともいわれています。

生成AI

生成AIにはいくつかの種類があります。例えば、文章生成AI、画像生成AI、動画生成AI、3Dモデル生成AIなどです。これらのAIがどのような製品やサービスに応用されているか、それぞれについて調査してみました。

■文章生成AI

文章生成AIは、自然言語処理技術（NLP:Natural Language Processing）と深層学習の技術を利用して、入力された情報に基づいて文章を自動的に生成するシステムです。主な応用例として、コンテンツの作成、チャットボット、翻訳、教育、クリエイティブライティングなどに使用することができます。

2022年11月にOpenAIのChatGPTが公開され、その性能の高さから、世間の注目を集めました。以下は現在まで公開された文章生成AIのリストです。表中のマルチモーダル化とは、異なる形式のデータ（例：テキスト、画像、音声、センサー情報など）を組み合わせることを言います（日付は、最新のリリースを示します（2024年6月時点））。

日付	名称	LLM	開発元	マルチモーダル化	備考
2022年11月	ChatGPT	GPT-3.5-turbo	OpenAI	－	パラメータ数: 175B(96層)
2023年2月	Bard	LaMDA	Google	－	パラメータ数: 137B
2023年3月	ChatGPT	GPT 4.0	OpenAI	○	パラメータ数: 非公表
2023年3月	Claude	Claude	Anthropic	－
2023年4月	Bard	PaLM	Google	－	パラメータ数: 540B
2023年5月	Bard	PaLM2	Google	－	パラメータ数: 非公表
2023年5月	Bing Chat	Megatron-Turing NLG	Microsoft	○
2023年7月	Claude 2	Claude 2	Anthropic	○
2023年11月	ChatGPT	GPT-4 Turbo	OpenAI	－	パラメータ数: 非公表
2023年12月	Gemini	Gemini	Google	○	Bardの後継モデル
2023年6月	Microsoft Copilot	GPT-3 Codex	Microsoft	－	コード生成に特化した大規模言語モデル
2024年4月	Claude 3	Claude 3	Anthropic	○
2024年5月	ChatGPT	GPT-4 o(omni)	OpenAI	○

■画像生成AI

画像生成AIは、人工知能の一種である深層学習を用いて、画像を自動的に生成する技術です。大量の画像データを学習することで、画像の特徴やパターンを理解し、人間が描いたかのようなオリジナルの画像を作成します。主な応用例として、イラスト・画像作成、画像編集、画像修復、画像のリアリティ向上、商品画像の作成などがあります。

2022年8月にStability AIのStable Diffusionがオープンソースとして公開され、商用利用も可能ということから、世間の注目を集めました。以下は現在まで公開された画像生成AIのリストです（日付は、最新のリリースを示します（2024年6月時点））。

日付	名称	開発元	備考
2022年4月	DALL·E 2	OpenAI	テキストから画像生成AI、招待制
2022年7月	Midjourney	Midjourney	テキストから画像生成AI
2022年8月	Stable Diffusion	Stability AI	オープンソースの画像生成AI
2023年1月	OpenJourney	OSS	Midjourneyをオープンソースで再現
2023年3月	Adobe Firefly	Adobe	Photoshop内の画像生成AI
2023年7月	SD XL	Stability AI	Stable Diffusionの後継
2023年9月	DALL·E 3	OpenAI	ChatGPTやBing Image Creatorで画像生成可能
2023年10月	Firefly Image 2	Adobe	Adobe Fireflyの後継
2024年3月	PIXART-Σ	HuaweiのNoah’s Ark Labと中国の複数の大学の研究者	テキスト→4K画像生成
2024年4月	Emi 2	AI Picasso社	AIアートの生成に特化した画像生成
2024年4月	Firefly Image 3 Foundation	Adobe	画像生成
2024年4月	EvoSDXL-JP	Sakana AI	日本語に特化した画像生成
2024年6月	Flash Diffusion	Jasper AI, INC.	テキスト→高速画像出力AI手法
2024年6月	Stable Diffusion 3 Medium	Stability AI	画像生成AIモデル

■音楽生成AI

音楽生成AIは、人工知能を用いて、自動的に音楽を生成する技術です。大量の音楽データを学習することで、音楽理論や作曲技法を理解し、人間が作曲したかのようなオリジナルの楽曲を生成しまう。主な応用例として、作曲支援、サウンドトラック生成、音楽教育、パーソナライズド音楽などがあります。

以下は現在まで公開された音楽生成AIのリストです（日付は、最新のリリースを示します（2024年6月時点））。

日付	名称	開発元	備考
2016年	AIVA	AIVA Technologies	AIによる作曲ソフトウェア
2020年3月	Jukebox	OpenAI	音楽生成
2020年9月	Soundraw	SOUNDRAW株式会社	AIによる音源生成サービス
2023年6月	MusicGen	Meta	オープンソース、デモ版公開
2023年8月	MusicLM	Google	音楽生成AI言語モデル
2023年8月	Audio Craft	Meta	オープンソース、デモ版公開
2023年9月	Stable Audio	Stability AI	音声/音楽生成AI
2023年11月	Lyria	Google DeepMind	音楽生成モデル
2023年11月	Music ControlNet	カーネギーメロン大学とAdobe Researchの研究チーム	音楽生成制御AI
2024年3月	Sonauto	Sonauto	ボーカル入り楽曲生成
2024年4月	Stable Audio 2.0	Stability AI	Stable Audioの新版
2024年4月	udio		テキストから高品質な音楽生成
2024年4月	Suno	Suno AI	プライベート企業による音楽生成AI
2024年5月	Music AI Sandbox	Google	音楽生成AIツールキット
2024年6月	Stable Audio Open	Stable Diffusion	オープンソースの音楽生成AI
	AI Jukebox		ブラウザだけで動く音楽生成

■動画生成AI

動画生成AIは、人工知能を用いて動画を自動的に生成する技術です。テキストや画像などの情報を基に、AIが映像や音声を組み合わせて新たな動画を作成します。従来の動画制作のように、撮影や編集を人が行う必要はなく、短時間でかつ低コストで動画を制作することができます。主な応用例として、映画・アニメ制作、広告制作、ゲーム開発、教育・トレーニング、医療バイオインフォマティクスなどがあります。

以下は現在まで公開された動画生成AIのリストです（日付は、最新のリリースを示します（2024年6月時点））。

日付	名称	開発元	備考
2018年9月	Video BRAIN	株式会社オープンエイト	AIビデオ編集ツール
2020年7月	Pictory	pictory.ai	テキストから画像生成モデル
2023年	GliaCloud	GliaCloud	ゲームAIクラウドサービス
2023年3月	Runway Gen-2	Runway	テキストから画像生成モデル
	InVideo	Whitesheep Technology Private Limited	オンライン動画編集ツール
	KaiBer	Kaiber	AIアバター生成ツール
	Steve AI	Anthropic	AIビデオホスト
	Elai	elai.ai	AIコンテンツ作成プラットフォーム
2023年1月	Deep AI Movie Creator	クリスタルメソッド	AI映画制作ツール
2023年6月	FlexClip	PearlMountain	オンライン動画作成ツール
2023年10月	Canva	Canva	画像・デザイン作成ツールでMagic Mediaで動画生成
2023年11月	Pika 1.0	ジェネレーティブ AI 映画会社の Pika Labs	AIビデオ編集ツール
2023年12月	Kn1ght	Qrow Pte. Ltd.	AIアニメアバター生成ツール
2024年	Lumen5	Lumen5	動画作成プラットフォーム
2024年1月	LUMIERE	Google	AI映像生成モデル
2024年2月	Stable Video Diffision	Stability AI	テキストから動画生成AI
2024年2月	Sora	OpenAI	テキストから動画生成AI
2024年4月	Vids	Google	ビジネス系動画生成
2024年4月	Pixverse	Pixverse	動画生成
2024年5月	Veo	Google	動画生成
2024年5月	Viva	HiDream.ai	テキスト･画像→高画質動画生成
2024年5月	EMOPortraits		画像→表情豊かなヘッドアバター動画生成
2024年5月	StoryDiffusion	中国のByteDanceと南開大学の研究チーム	ストーリー性のある長尺画像･動画生成
2024年5月	Vidu	中国のShengshu Technologyと清華大学が共同開発	動画生成
2024年5月	Synthesia	Synthesia Limited	表情豊かなしゃべるAIアバター生成ツール
2024年5月	VASA-1	Microsoft	人物画像と音声→しゃべるアバター動画生成
2024年6月	Dream Machine	Luma AI	AI映像生成プラットフォーム
2024年6月	可灵（Kling）	快手（Kuaishou）	ジェネレーティブAIプラットフォーム
	Noisee AI	Noisee AI	サウンド付きの動画生成
2024年	Mootion Storyteller	HK Mootion Limited	ストーリー動画生成
	Digen		人物がしゃべるリアル動画生成

■3Dモデル生成AI

3Dモデル生成AIは、人工知能を用いて3Dモデルを自動的に生成する技術です。画像やテキストなどの情報を基に、AIが形状や質感、色などを分析し、3Dモデルを作成します。従来の3Dモデリングではソフトを使って手作業でモデリングする必要がありましたが、この技術を使えば短時間で簡単に3Dモデルを作成することができます。主な応用例として、ゲーム開発、建築設計、医療、エンターテインメントなどがあります。

以下は現在まで公開された3Dモデル生成AIのリストです（日付は、最新のリリースを示します（2024年6月時点））。

日付	名称	開発元	備考
	Mirageml	Mirage ML Inc.	ポリシーベースのAIモデル
	Meshery		画像やテキストから3Dモデルを生成
	Dream Gaussian		画像やテキストから3Dモデルを生成
2021年12月	HyperNeRF	Google	高画質な3Dモデルを生成
2023年3月	GENIE	Luma AI	画像やテキストから3Dモデルを生成
2023年5月	Shap-E	OpenAI
2023年11月	Cube by CSM		1枚の画像から3Dモデルを生成
2023年12月	Doodle Your 3D
	ShapeLab		画像から3Dモデルを生成
	Ganerator		テキストから3Dモデルを生成
2024年3月	Adobe Substance 3D	Adobe	汎用AI生成モデル、Adobe Firefly 生成AIを統合
2024年4月	InstantMesh	中国のテンセント	画像→3Dモデル高速生成
2024年5月	Unique3D		画像→高品質な3Dモデル生成
2024年5月	Meshy-3	Meshy LLC	テキスト･画像→3Dモデル生成
2024年6月	Project Neo	Adobe	3Dコンテンツ生成

生成AI活用

各生成AI分野でさまざまなサービスやモデルが開発されています。この傾向は今後も続くと考えられます。これらの生成AI技術をうまく活用することが、企業の発展にとって極めて重要な要素となっています。この技術は、データ解析、顧客サービス、マーケティング戦略の策定など、さまざまなプロセスに革新をもたらします。しかし、生成AIを効果的に活用するためには、単なる技術導入だけでなく、経営層の深い理解と積極的な関与が不可欠です。

生成AIとは、大規模なデータセットを用いて新しいデータやコンテンツを生成する技術です。前述したサービスやモデルを使用することで、例えば、チャットボットやバーチャルアシスタントは、自然言語処理技術を活用して顧客対応を自動化し、効率化することができます。また、画像生成技術は、広告やデザインの分野で新しいクリエイティブを生み出す手助けとなります。

生成AIの導入には、経営層がそのメリットとリスクを正確に評価することが求められます。AI技術は正しく利用すれば大きな利益をもたらしますが、不適切な運用や倫理的な問題が発生する可能性もあります。例えば、データプライバシーの問題やバイアスのあるアルゴリズムの使用は、企業の信頼性を損なうリスクがあります。経営層は、これらのリスクを理解し、適切なガバナンスとコンプライアンスの枠組みを構築する必要があります。

さらに、生成AIの効果的な活用には、経営層のリーダーシップが重要です。経営層がAIプロジェクトを主導し、会社的な支援を確保することで、技術の導入の成功率が高まります。具体的には、AIに関するビジョンを明確にし、社内のステークホルダーと共有することが求められます。また、適切なリソースの配分やスキル開発の支援を行うことで、従業員が生成AI技術を効果的に活用できる環境を整備することも重要です。

調査結果によると、生成AIの成功には経営層の積極的な関与が不可欠であることが示されています。具体的な事例として、ある企業では、経営層が生成AIの導入を主導し、社内の教育プログラムを通じて従業員のスキル向上を図った結果、生産性が大幅に向上したと報告されています。また、別の企業では、経営層が生成AIの倫理的使用に関するガイドラインを策定し、透明性を確保することで、顧客からの信頼を得ました。

結論として、生成AIの導入は企業の競争力を高める大きなポテンシャルを秘めていますが、その成功には経営層の理解と積極的な関与が欠かせません。経営層が生成AIの技術的側面だけでなく、その戦略的な重要性を理解し、全社的な取り組みを進めることで、生成AIの真の価値を引き出すことができるのではないでしょうか。

今回紹介した生成AIのサービスは、無料で使用できるものもあります。是非この機会に生成AIを実際に体験してみてください。

第12回は、強化学習の基礎である「マルコフ決定過程、ベルマン方程式、動的計画法、モンテカルロ法など」について詳しく紹介していきます。

参考資料
１）Adobe Blog「生成AI最前線：生成AIシーンのリーダーが伝える”企業がいま取り組むべきこと“｜Adobe Firefly Meetup#1」Yuji Sakai　04-15-2024
２）YouTube　AI大学【AI＆ChatGPT最新情報】
３）PwCコンサルティング合同会社「生成AIに関する実態調査2024春－試行錯誤の中で見え始める二極化の兆し：生成AIを経営資源の１つとする変革の始まり」（2024-06-17）
※上記参考資料の最終参照日は2024年6月