技術資料
Feel&Think
第11回 生成AI(Generative AI)
前回の「地層科学分野でのAI活用事例(トンネル編)」では、AIの活用事例として既存の論文の整理を行い体系的にまとめ、現在の建設業界におけるデジタル革命と合わせて紹介しました。
今回は、以前紹介した内容と最新の情報を踏まえ、「生成AI」に関するさまざまな側面を紹介していきます。
概要
生成AI(Generative AI)とは、その名の通り、今までの識別系AIとは能力が異なり、言語だけでなく、画像、動画、音楽など様々なものを生成することができます。そのクオリティは、1年前とは比べ物にならないほど向上しており、さらに進化し続けています。このような技術がどのようにビジネスで活用できるかについて、現在多くの企業が調査・研究を進めています。既に先行してビジネス展開している企業もあり、この状況はインターネットが普及したとき以上のインパクトがあるともいわれています。
生成AI
生成AIにはいくつかの種類があります。例えば、文章生成AI、画像生成AI、動画生成AI、3Dモデル生成AIなどです。これらのAIがどのような製品やサービスに応用されているか、それぞれについて調査してみました。
■文章生成AI
文章生成AIは、自然言語処理技術(NLP:Natural Language Processing)と深層学習の技術を利用して、入力された情報に基づいて文章を自動的に生成するシステムです。主な応用例として、コンテンツの作成、チャットボット、翻訳、教育、クリエイティブライティングなどに使用することができます。
2022年11月にOpenAIのChatGPTが公開され、その性能の高さから、世間の注目を集めました。以下は現在まで公開された文章生成AIのリストです。表中のマルチモーダル化とは、異なる形式のデータ(例:テキスト、画像、音声、センサー情報など)を組み合わせることを言います(日付は、最新のリリースを示します(2024年6月時点))。
■画像生成AI
画像生成AIは、人工知能の一種である深層学習を用いて、画像を自動的に生成する技術です。大量の画像データを学習することで、画像の特徴やパターンを理解し、人間が描いたかのようなオリジナルの画像を作成します。主な応用例として、イラスト・画像作成、画像編集、画像修復、画像のリアリティ向上、商品画像の作成などがあります。
2022年8月にStability AIのStable Diffusionがオープンソースとして公開され、商用利用も可能ということから、世間の注目を集めました。以下は現在まで公開された画像生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。
日付 | 名称 | 開発元 | 備考 |
---|---|---|---|
2022年4月 | DALL·E 2 | OpenAI | テキストから画像生成AI、招待制 |
2022年7月 | Midjourney | Midjourney | テキストから画像生成AI |
2022年8月 | Stable Diffusion | Stability AI | オープンソースの画像生成AI |
2023年1月 | OpenJourney | OSS | Midjourneyをオープンソースで再現 |
2023年3月 | Adobe Firefly | Adobe | Photoshop内の画像生成AI |
2023年7月 | SD XL | Stability AI | Stable Diffusionの後継 |
2023年9月 | DALL·E 3 | OpenAI | ChatGPTやBing Image Creatorで画像生成可能 |
2023年10月 | Firefly Image 2 | Adobe | Adobe Fireflyの後継 |
2024年3月 | PIXART-Σ | HuaweiのNoah’s Ark Labと中国の複数の大学の研究者 | テキスト→4K画像生成 |
2024年4月 | Emi 2 | AI Picasso社 | AIアートの生成に特化した画像生成 |
2024年4月 | Firefly Image 3 Foundation | Adobe | 画像生成 |
2024年4月 | EvoSDXL-JP | Sakana AI | 日本語に特化した画像生成 |
2024年6月 | Flash Diffusion | Jasper AI, INC. | テキスト→高速画像出力AI手法 |
2024年6月 | Stable Diffusion 3 Medium | Stability AI | 画像生成AIモデル |
■音楽生成AI
音楽生成AIは、人工知能を用いて、自動的に音楽を生成する技術です。大量の音楽データを学習することで、音楽理論や作曲技法を理解し、人間が作曲したかのようなオリジナルの楽曲を生成しまう。主な応用例として、作曲支援、サウンドトラック生成、音楽教育、パーソナライズド音楽などがあります。
以下は現在まで公開された音楽生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。
日付 | 名称 | 開発元 | 備考 |
---|---|---|---|
2016年 | AIVA | AIVA Technologies | AIによる作曲ソフトウェア |
2020年3月 | Jukebox | OpenAI | 音楽生成 |
2020年9月 | Soundraw | SOUNDRAW株式会社 | AIによる音源生成サービス |
2023年6月 | MusicGen | Meta | オープンソース、デモ版公開 |
2023年8月 | MusicLM | 音楽生成AI言語モデル | |
2023年8月 | Audio Craft | Meta | オープンソース、デモ版公開 |
2023年9月 | Stable Audio | Stability AI | 音声/音楽生成AI |
2023年11月 | Lyria | Google DeepMind | 音楽生成モデル |
2023年11月 | Music ControlNet | カーネギーメロン大学とAdobe Researchの研究チーム | 音楽生成制御AI |
2024年3月 | Sonauto | Sonauto | ボーカル入り楽曲生成 |
2024年4月 | Stable Audio 2.0 | Stability AI | Stable Audioの新版 |
2024年4月 | udio | テキストから高品質な音楽生成 | |
2024年4月 | Suno | Suno AI | プライベート企業による音楽生成AI |
2024年5月 | Music AI Sandbox | 音楽生成AIツールキット | |
2024年6月 | Stable Audio Open | Stable Diffusion | オープンソースの音楽生成AI |
AI Jukebox | ブラウザだけで動く音楽生成 |
■動画生成AI
動画生成AIは、人工知能を用いて動画を自動的に生成する技術です。テキストや画像などの情報を基に、AIが映像や音声を組み合わせて新たな動画を作成します。従来の動画制作のように、撮影や編集を人が行う必要はなく、短時間でかつ低コストで動画を制作することができます。主な応用例として、映画・アニメ制作、広告制作、ゲーム開発、教育・トレーニング、医療バイオインフォマティクスなどがあります。
以下は現在まで公開された動画生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。
日付 | 名称 | 開発元 | 備考 |
---|---|---|---|
2018年9月 | Video BRAIN | 株式会社オープンエイト | AIビデオ編集ツール |
2020年7月 | Pictory | pictory.ai | テキストから画像生成モデル |
2023年 | GliaCloud | GliaCloud | ゲームAIクラウドサービス |
2023年3月 | Runway Gen-2 | Runway | テキストから画像生成モデル |
InVideo | Whitesheep Technology Private Limited | オンライン動画編集ツール | |
KaiBer | Kaiber | AIアバター生成ツール | |
Steve AI | Anthropic | AIビデオホスト | |
Elai | elai.ai | AIコンテンツ作成プラットフォーム | |
2023年1月 | Deep AI Movie Creator | クリスタルメソッド | AI映画制作ツール |
2023年6月 | FlexClip | PearlMountain | オンライン動画作成ツール |
2023年10月 | Canva | Canva | 画像・デザイン作成ツールでMagic Mediaで動画生成 |
2023年11月 | Pika 1.0 | ジェネレーティブ AI 映画会社の Pika Labs | AIビデオ編集ツール |
2023年12月 | Kn1ght | Qrow Pte. Ltd. | AIアニメアバター生成ツール |
2024年 | Lumen5 | Lumen5 | 動画作成プラットフォーム |
2024年1月 | LUMIERE | AI映像生成モデル | |
2024年2月 | Stable Video Diffision | Stability AI | テキストから動画生成AI |
2024年2月 | Sora | OpenAI | テキストから動画生成AI |
2024年4月 | Vids | ビジネス系動画生成 | |
2024年4月 | Pixverse | Pixverse | 動画生成 |
2024年5月 | Veo | 動画生成 | |
2024年5月 | Viva | HiDream.ai | テキスト・画像→高画質動画生成 |
2024年5月 | EMOPortraits | 画像→表情豊かなヘッドアバター動画生成 | |
2024年5月 | StoryDiffusion | 中国のByteDanceと南開大学の研究チーム | ストーリー性のある長尺画像・動画生成 |
2024年5月 | Vidu | 中国のShengshu Technologyと清華大学が共同開発 | 動画生成 |
2024年5月 | Synthesia | Synthesia Limited | 表情豊かなしゃべるAIアバター生成ツール |
2024年5月 | VASA-1 | Microsoft | 人物画像と音声→しゃべるアバター動画生成 |
2024年6月 | Dream Machine | Luma AI | AI映像生成プラットフォーム |
2024年6月 | 可灵(Kling) | 快手(Kuaishou) | ジェネレーティブAIプラットフォーム |
Noisee AI | Noisee AI | サウンド付きの動画生成 | |
2024年 | Mootion Storyteller | HK Mootion Limited | ストーリー動画生成 |
Digen | 人物がしゃべるリアル動画生成 |
■3Dモデル生成AI
3Dモデル生成AIは、人工知能を用いて3Dモデルを自動的に生成する技術です。画像やテキストなどの情報を基に、AIが形状や質感、色などを分析し、3Dモデルを作成します。従来の3Dモデリングではソフトを使って手作業でモデリングする必要がありましたが、この技術を使えば短時間で簡単に3Dモデルを作成することができます。主な応用例として、ゲーム開発、建築設計、医療、エンターテインメントなどがあります。
以下は現在まで公開された3Dモデル生成AIのリストです(日付は、最新のリリースを示します(2024年6月時点))。
日付 | 名称 | 開発元 | 備考 |
---|---|---|---|
Mirageml | Mirage ML Inc. | ポリシーベースのAIモデル | |
Meshery | 画像やテキストから3Dモデルを生成 | ||
Dream Gaussian | 画像やテキストから3Dモデルを生成 | ||
2021年12月 | HyperNeRF | 高画質な3Dモデルを生成 | |
2023年3月 | GENIE | Luma AI | 画像やテキストから3Dモデルを生成 |
2023年5月 | Shap-E | OpenAI | |
2023年11月 | Cube by CSM | 1枚の画像から3Dモデルを生成 | |
2023年12月 | Doodle Your 3D | ||
ShapeLab | 画像から3Dモデルを生成 | ||
Ganerator | テキストから3Dモデルを生成 | ||
2024年3月 | Adobe Substance 3D | Adobe | 汎用AI生成モデル、Adobe Firefly 生成AIを統合 |
2024年4月 | InstantMesh | 中国のテンセント | 画像→3Dモデル高速生成 |
2024年5月 | Unique3D | 画像→高品質な3Dモデル生成 | |
2024年5月 | Meshy-3 | Meshy LLC | テキスト・画像→3Dモデル生成 |
2024年6月 | Project Neo | Adobe | 3Dコンテンツ生成 |
生成AI活用
各生成AI分野でさまざまなサービスやモデルが開発されています。この傾向は今後も続くと考えられます。これらの生成AI技術をうまく活用することが、企業の発展にとって極めて重要な要素となっています。この技術は、データ解析、顧客サービス、マーケティング戦略の策定など、さまざまなプロセスに革新をもたらします。しかし、生成AIを効果的に活用するためには、単なる技術導入だけでなく、経営層の深い理解と積極的な関与が不可欠です。
生成AIとは、大規模なデータセットを用いて新しいデータやコンテンツを生成する技術です。前述したサービスやモデルを使用することで、例えば、チャットボットやバーチャルアシスタントは、自然言語処理技術を活用して顧客対応を自動化し、効率化することができます。また、画像生成技術は、広告やデザインの分野で新しいクリエイティブを生み出す手助けとなります。
生成AIの導入には、経営層がそのメリットとリスクを正確に評価することが求められます。AI技術は正しく利用すれば大きな利益をもたらしますが、不適切な運用や倫理的な問題が発生する可能性もあります。例えば、データプライバシーの問題やバイアスのあるアルゴリズムの使用は、企業の信頼性を損なうリスクがあります。経営層は、これらのリスクを理解し、適切なガバナンスとコンプライアンスの枠組みを構築する必要があります。
さらに、生成AIの効果的な活用には、経営層のリーダーシップが重要です。経営層がAIプロジェクトを主導し、会社的な支援を確保することで、技術の導入の成功率が高まります。具体的には、AIに関するビジョンを明確にし、社内のステークホルダーと共有することが求められます。また、適切なリソースの配分やスキル開発の支援を行うことで、従業員が生成AI技術を効果的に活用できる環境を整備することも重要です。
調査結果によると、生成AIの成功には経営層の積極的な関与が不可欠であることが示されています。具体的な事例として、ある企業では、経営層が生成AIの導入を主導し、社内の教育プログラムを通じて従業員のスキル向上を図った結果、生産性が大幅に向上したと報告されています。また、別の企業では、経営層が生成AIの倫理的使用に関するガイドラインを策定し、透明性を確保することで、顧客からの信頼を得ました。
結論として、生成AIの導入は企業の競争力を高める大きなポテンシャルを秘めていますが、その成功には経営層の理解と積極的な関与が欠かせません。経営層が生成AIの技術的側面だけでなく、その戦略的な重要性を理解し、全社的な取り組みを進めることで、生成AIの真の価値を引き出すことができるのではないでしょうか。
今回紹介した生成AIのサービスは、無料で使用できるものもあります。是非この機会に生成AIを実際に体験してみてください。
第12回は、強化学習の基礎である「マルコフ決定過程、ベルマン方程式、動的計画法、 モンテカルロ法など」について詳しく紹介していきます。
参考資料
1)Adobe Blog「生成AI最前線:生成AIシーンのリーダーが伝える”企業がいま取り組むべきこと“|Adobe Firefly Meetup#1」Yuji Sakai 04-15-2024
2)YouTube AI大学【AI&ChatGPT最新情報】
3)PwCコンサルティング合同会社「生成AIに関する実態調査2024春-試行錯誤の中で見え始める二極化の兆し:生成AIを経営資源の1つとする変革の始まり」(2024-06-17)
※上記参考資料の最終参照日は2024年6月