生成AIについて

生成AIとは、人工知能(AI)を使って、新しいデータやコンテンツを作ることができる技術のことです。 たとえば、写真や絵、文章や音楽などを生成AIが自動的に作ることができます。 生成AIは、人間が作ったデータをたくさん見て勉強して、そのデータの特徴やパターンを覚えます。 そして、その特徴やパターンに基づいて、新しいデータやコンテンツを作り出します。 生成AIは、人間が作ったものと似ているけれども、同じではないものを作ることができます。

例えば、生成AIに「猫の絵を描いて」と頼むと、生成AIは人間が描いた猫の絵をたくさん見て勉強します。 そして、猫の絵の特徴やパターンを覚えて、新しい猫の絵を描きます。 生成AIが描いた猫の絵は、人間が描いた猫の絵に似ていますが、同じではありません。 生成AIは、自分で考えて色や形などを変えています。 生成AIは、人間がまだ見たことのない猫の絵を作ることができます。

生成AIは、人間が作ることが難しいデータやコンテンツを作ることにも役立ちます。 たとえば、生成AIに「新しい薬の分子を作って」と頼むと、生成AIは人間が作った薬の分子をたくさん見て勉強します。 そして、薬の分子の特徴やパターンを覚えて、新しい薬の分子を作ります。 生成AIが作った薬の分子は、人間が作った薬の分子に似ていますが、同じではありません。 生成AIは、自分で考えて化学的な構造や組成などを変えています。 生成AIは、人間がまだ発見していない薬の分子を作ることができます。

このように、生成AIは人工知能を使って新しいデータやコンテンツを作ることができる技術です。 生成AIはさまざまな分野で活用されており、今後もさらに進化していくことが期待されています。

生成 AI の具体例

  • テキスト生成 AI:文章、コード、脚本、音楽、詩など、さまざまなテキストを生成できます。
  • 画像生成 AI:写真、絵画、イラスト、グラフィックなど、さまざまな画像を生成できます。
  • 音声生成 AI:ナレーション、歌、音楽、効果音など、さまざまな音声を生成できます。
  • 動画生成 AI:映画、テレビ番組、アニメ、ミュージックビデオなど、さまざまな動画を生成できます。

※音声生成と動画生成については省略します。

テキスト生成 AI

  • ChatGPT は、 OpenAI が開発したテキスト生成 AI です。 テキストとコードの膨大なデータセットで学習されており、自然な文章を生成できることが特徴です。 クリエイティブコンテンツの作成、翻訳、質問応答などの用途に活用されています。 Google アカウントを使ってログインすると便利だと思います。 無料版ですと GTP-3.5 が使用できます(有料ですと GTP-4.0 で月額 20 ドル)。 無料版でも十分使えると思います。
  • Google Bardは、 Google が開発したテキスト生成 AI です。 テキストの膨大なデータセットで学習されており、幅広い知識を応用した回答ができることが特徴です。 情報検索、コンテンツ作成、機械翻訳などの用途に活用されています。 Google アカウントを使ってログインしている状態で使えます。
  • Bing AI Chat は、Microsoft と OpenAI が開発したテキスト生成 AI です。 テキストとコードの膨大なデータセットで学習されており、自然な会話を生成できることが特徴です。 チャットボット、対話型 AI などの用途に活用されています。 OpenAIのChatGPT4.0 クラスの性能と言われます。 Bing AI Chat は Microsoft製なので、Microsoft Edge ブラウザをき右上隅の「b」のボタンを押すことで画面が開き、 そこからチャットが始められます。 Microsoft アカウントにログインした状態で行った方が、チャットできる回数が増えます。
  • Claude2 はChatGPTを開発したOpenAIにいたメンバーが設立したAnthropic(アンソロピック)社が開発した最新の会話型生成AIです。 読み込めるトークン数が多いです(ChatGPTを大きく上回る)。Google アカウントを使ってログインすると便利だと思います。

※テキスト生成 AI 全般に言えることですが、生成された文章に「ハルシネーション 」と呼ばれる嘘が入ることがありますので、注意してご利用ください。

画像生成 AI

Midjourney と Stable Diffusion が有名なのですが、Midjourney は有料、Stable Diffusion は高スペックパソコンにインストールする必要があるので、 ここでは違うものをご紹介します。

  • leonardo.ai
    Google アカウントを使ってログインすると便利だと思います。 全編英語ですが、1日で一定回数無料で使えます。
  • foxify.art
    Google アカウントを使ってログインすると便利だと思います。 こちらは日本語です。1日で一定回数無料で使えます。
  • tensor.art
    Google アカウントを使ってログインすると便利だと思います。 全編英語ですが、1日で一定回数無料で使えます。
  • seaart.ai
    Google アカウントを使ってログインすると便利だと思います。 こちらは日本語です。1日で一定回数無料で使えます。
  • Bing Image Creator
    Bing Image Creator は、Microsoft が OpenAIのDALL·E 3を使用して開発した画像生成 AI です。 Microsoft アカウントにログインした状態で使用します。 こちらの現時点(2023-10-06)での特長は、生成画像に「文字入れ」ができます。

画像生成AIへのプロンプト

画像生成AIへのプロンプトとは、AIに画像を生成させるための文章やフレーズです。 プロンプトは、画像の内容やスタイルを詳細に記述することで、AIが望ましい出力を提供する可能性を高めます。 プロンプトの作成方法は、様々なサービスやモデルによって異なりますが、一般的には以下のような要素を含めると良いとされています。

  • 画像の主題(人物、動物、風景など)
  • 画像の媒体(デジタルペインティング、写真、油絵など)
  • 画像のスタイル(リアルなもの、幻想的なもの、特定のアーティストやウェブサイトのスタイルなど)
  • 画像の解像度(鮮明さやサイズ)
  • 画像に追加したい詳細(色、照明、効果など)

例えば、「青いドレスを着た若い女性が木製の窓の隣で本を読んでいる」という画像を生成させたい場合は、次のようなプロンプトを作成できます。

Digital painting of a young woman with light blue dress sitting next to a wooden window reading a book, by Stanley Artgerm Lau, artstation, 8k, extremely detailed, ornate, cinematic lighting, rim lighting, vivid

seaart.ai (ReV Animated) で作成した例
seaart.ai (ReV Animated) で作成した例

このプロンプトでは、以下の要素が含まれています。

  • 主題: 青いドレスを着た若い女性が木製の窓の隣で本を読んでいる
  • 媒体: デジタルペインティング
  • スタイル: Stanley Artgerm Lau のスタイル、artstation のスタイル
  • 解像度: 8k
  • 追加の詳細: 非常に詳細で装飾的な要素、映画的な照明、リムライティング、鮮やかな色

このように、プロンプトは画像生成AIに対する指示や要求として機能します。ただし、プロンプトは必ずしもAIが理解できるとは限りません。AIは人間と違って思考や感覚が異なるため、プロンプトに曖昧さや矛盾があると、意図しない出力を生成する可能性があります。そのため、プロンプトはできるだけ明確かつ具体的に記述することが重要です。

また、プロンプトは英語で記述することが推奨されます。英語は多くのAIモデルにとって最も効果的な言語であると一般的に考えられています。日本語で記述した場合は、翻訳ツールなどを利用して英語に変換することが望ましいです。

Back to top