画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る（CloseBox）

Facebookでは「～年前の自分の投稿」を再度シェアするよう促してくるお節介な機能があります。これにより気づくことも多く、自分はけっこう重宝しています。さて、そのFacebookが思い出させてくれたのが、2022年12月17日の自分の画像投稿でした。

同日、生成AIを自分で使ってみた最初の記事をテクノエッジのこの連載コラムで公開。その後の生成AIブームに乗っかった形で新しい技術を試していくという流れができました。

というわけで、ここを起点に、2023年のちょっと前からの生成AIの動きを自分の取り組みを中心にまとめてみます。一般ユーザーが実践できるものとしてどのように進化してきたかを振り返る手掛かりになれば幸いです。

2022年12月：特定人物の画像生成でカスタム学習が可能に

AI研究家の清水亮さんが運営しているAI画像生成サービス「Memeplex」が、画像生成エンジンであるStable Diffusionでカスタム学習を可能にするDreamBoothを誰でも使えるようにしたのが2022年12月24日のこと。特定人物の複数の写真をカスタム学習させることで、その人物の特徴を持った画像を生成できる機能を、Memeplexの有償サブスクリプション会員限定で提供し始めました。その少し前からこの機能は清水さんのnote記事購入者が利用できるようになっていて、それを元に書いた記事が、「AIと呪文で、もう逢えない妻の新しい写真を捏造した」という記事（2022年12月17日）です。

AIと呪文で、もう逢えない妻の新しい写真を捏造した（CloseBox） | テクノエッジ TechnoEdge

AIを使えば亡くなった人の新しい写真が撮影できる……そんなことを試してみました。

https://www.techno-edge.net/article/2022/12/17/634.html続きを読む »

この当時は、Stable Diffusionをローカルマシンで動かしたり、DreamBoothを使えるようにするためには相当のスキルが必要で、目的とする画像に到達するためのハードルはかなり高いものでした。さらに、ベースにするAIモデルの選択やプロンプトの組み方などの情報が少なく、西川和久さんがまだこの分野で記事を書かれていなかった時期でもあります。

試行錯誤しながら書いた記事がちょうど1年前の「AIという異世界カメラ。旅立った妻の美しい姿を写す呪文の唱え方」（2022年12月27日）。

AIという異世界カメラ。旅立った妻の美しい姿を写す呪文の唱え方（CloseBox） | テクノエッジ TechnoEdge

9年半前に旅立った妻の「新しい写真」を撮るための呪文生成の方法について語ります。

https://www.techno-edge.net/article/2022/12/27/663.html続きを読む »

2023年1月：AIボイスチェンジャーとChatGPTの登場

この時点で、他界した妻の画像を生成AIで作っていることに対する反感が生まれています。そうした反感コメントに対する筆者の考えを述べた記事も書きました。今も、ほぼ付け足すことはありません。

「亡き妻の写真」をAIで生成していることへのご意見について回答します（CloseBox） | テクノエッジ TechnoEdge

亡き妻のAI写真を記事にしたところ、反発の声がいくつか挙がりました。当事者である筆者がそれにお答えしたいと思います。

https://www.techno-edge.net/article/2023/01/06/688.html続きを読む »

こうして生成した妻の画像を、10年前から取り組んでいる、従来型音声合成による妻の歌声と組み合わせたミュージックビデオを作って公開したところ、音声合成についても機械学習を使った画期的な技術があることをコメントで教えてもらいました。やってみるものです。

亡き妻の歌声とAI画像でミュージックビデオを作りました（CloseBox） | テクノエッジ TechnoEdge

亡き妻の写真をもとにAI作画したイメージを使って、ミュージックビデオを作りました。歌声もまた、コンピュータで合成したものです。

https://www.techno-edge.net/article/2023/01/09/694.html続きを読む »

AI歌声合成はじめます。AI作画ミュージックビデオ制作成功で妻音源を次の段階へ（CloseBox） | テクノエッジ TechnoEdge

これまでUTAU-Synthという、音の素片を切り貼りする技術で妻の歌声を合成してきましたが、AI歌声合成が自分でできるようになったと聞き、実践してみることにしました。

https://www.techno-edge.net/article/2023/01/16/714.html続きを読む »

教えてもらった技術は、「Diff-SVC」と呼ばれる、Diffusionモデルを使ったオープンソースソフト。いわゆるボイスチェンジャーソフトですが、特定個人の音声を学習し、その人の声の特徴を模倣できるものです。同様のことは従来でもあったのですが、その元データのラベリングや補正処理をほとんど無しで済ませられることが画期的でした。それを試してみたのが1月19日の記事です。

好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか（CloseBox） | テクノエッジ TechnoEdge

無料で使えるAIボイチェン「Diff-SVC」を使って、妻の歌声を再現してみました。

https://www.techno-edge.net/article/2023/01/19/731.html続きを読む »

Diff-SVCを使った歌声の作例としては、日本では最初期に近いものでした。筆者が自分で歌ったものをDiff-SVCで妻の歌声に変換し、それにStable Diffusion（Memeplex）で生成した妻の画像を組み合わせたミュージックビデオも公開しました。

12月にアナウンスされた「第一回AIアートグランプリ」には、このミュージックビデオをそのままAIアート作品として応募しました。締め切りは1月末だったので、かなりギリギリ。同一人物のAI画像合成と音声合成をまとめることができたのは、時期的にこのタイミングが最速だったからです。

AI作画・AI作曲・AIゲーム制作などを競う「AIアートグランプリ」開催決定。グランプリは10万円+RTX 4080マシン | テクノエッジ TechnoEdge

審査員長は河口洋一郎東大名誉教授、樋口真嗣監督など審査員を務めるAI作品コンテストが開催されます。

https://www.techno-edge.net/article/2022/12/12/608.html続きを読む »

一方で、今や大きな社会問題となっている、アーティストの歌声を勝手に真似ることがソフトウェアの開発に悪影響を及ぼすことになった事例もありました。この問題は今も引きずっています。

破壊的でヤバいAI歌声合成「Diff-SVC」がGoogle Colabでの公開停止。一部ユーザーがセレブや商用音源を勝手に利用で自主制限（CloseBox） | テクノエッジ TechnoEdge

Google Colabを使って手軽にAIボイスを作成できるNotebookが公開を停止してしまった。その背景には、不心得なユーザーによる行為がある。

https://www.techno-edge.net/article/2023/01/23/742.html続きを読む »

絵、音が先行した生成AIですが、一般的に大きな広がりを見せることになったきっかけはなんといってもChatGPTの登場でしょう。

筆者が最初にChatGPTを使ったのは1月30日の記事でした。作曲のための補助として。このときのChatGPTには作詞とコード進行を担当してもらい、演奏とメロディーラインは自分で作るというものでした。これが「Suno」の登場で一気に完成形まで行けちゃうのだからその後の進化スピードがすごいです。

ChatGPTといっしょに曲作りをしてみた。俺たちコンビ、けっこうやっていけるかも（CloseBox） | テクノエッジ TechnoEdge

この連載でのAIチャレンジ、まだChatGPTがまだでした。使い始めていきなりですが、作曲をやってもらおうと思います。

https://www.techno-edge.net/article/2023/01/30/779.html続きを読む »

2023年2月：AIアニメーション技術が続々登場

1月ほどの勢いはないものの、2月も画像生成AIの進化は続きます。最初にきたのは、GIFアニメーションを作るツール「Tune-A-Video」。1枚の静止画を数枚のカクカクした動画にする技術です。最近の動きと比べるとずいぶんプリミティブなものですが、当時としては画期的なものでした。

AI作画がアニメーションできるようになったので、異世界にいる妻をのぞいてみたら楽しすぎた（CloseBox） | テクノエッジ TechnoEdge

AIイラスト生成サービスのMemeplexが、アニメーションの出力に対応。さっそくこの新機能を使ってミュージックビデオを作ってみました。歌声もAI、アニメもAIです。

https://www.techno-edge.net/article/2023/02/03/815.html続きを読む »

続いてリップシンクが可能になりました。いわゆる口パクですね。オーディオデータに合わせて口を中心とした自然な顔のアニメーションを可能にする技術です。以前からCrazyTalkなどの技術はありましたが、機械学習を使ってより自然なものにできています。2月14日の記事で紹介した「D-ID」という有料サービスは今では性能的にちょっと遅れたものになってしまいましたが。ミュージックビデオに使うにはこの時点で最高のサービスでした。

AI作画でも顔写真でも自由にしゃべり、歌わせられる動画技術を試してみた（CloseBox） | テクノエッジ TechnoEdge

D-IDというフェイシャルアニメーション技術がすごいというので試してみました。

https://www.techno-edge.net/article/2023/02/14/864.html続きを読む »

さらに、1枚絵を拡大・縮小しながら次々にアニメーションを展開できる技術「Kaiber」も登場します（3月2日）。手描きアニメーションでやったとしたらどれだけ工数がかかるだろう、という表現を一発でできるのはすごい可能性を感じるものです。この有料サービスは今もサブスクしていて、たまに使っています。

これはゲームチェンジャーか。AI呪文によるアニメ作成「Kaiber.ai」、ポーズからAI転写できる「T2I-Adapter」を試してみた（CloseBox） | テクノエッジ TechnoEdge

「毎日がゲームチェンジャー」な生成系AI。動画作成でもまたゲームチェンジャーが現れたようです。

https://www.techno-edge.net/article/2023/03/02/952.html続きを読む »

3月：第一回AIアートグランプリ受賞

3月12日、予想もしていなかったことが起きます。筆者が投稿した作品「Desperado by 妻音源とりちゃん[AI]」が第一回AIアートグランプリを獲得。生成AIアートの大規模なコンテストとしては日本で初ということもあり、マスコミにも大きな注目を浴びることになりました。他のコンテスト入選作品を含む解説記事も書きました。

第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先（CloseBox） | テクノエッジ TechnoEdge

第一回AIアートグランプリに応募し、グランプリを獲得した筆者によるレポート。

https://www.techno-edge.net/article/2023/03/13/1006.html続きを読む »

今振り返ると、この時の佳作入選作の中に、第二回AIアートグランプリを「明日のあたしのアバタイズ」で獲得した／快亭木魚さん、優秀賞を「幻視影絵」で獲得した実験東京の安野貴博さんの名前がすでにあるのが確認できます。

4月：AIボイチェンの決定版「SVC」登場

4月に入ると、画像生成AIのStable Diffusionは基本解像度が上がり、モデルも格段に良くなったSDXLが登場。

画像生成AI「Stable Diffusion XL」登場。DreamStudioならもう使えて、日本らしい人物・風景が簡単に生成できる（CloseBox） | テクノエッジ TechnoEdge

https://www.techno-edge.net/article/2023/04/03/1107.html続きを読む »

一方、AIボイチェンはDiff-SVCから新たなエンジン「SVC」へとバトンタッチされます。こちらはより精度が高く、少ない元データで、学習時間も短くて済む上、推論も高速という、いいことだらけのソフト。最初からWeb UIで使えます。妻音源とりちゃん[AI]は、これ以降ずっとSVCを使っています。さらに、ノートPCでリアルタイム変換できるソフトも登場し、リアルコナン君ごっこもできるように。Shiftallのmutalkを使って、リアルな場でAIボイチェンする実験もやってみました。

AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能（CloseBox） | テクノエッジ TechnoEdge

またゲームチェンジャーです。1時間の音声を20分で学習。リアルタイムでボイチェンできる音声変換ソフトの登場です。しかも変換だけならMacで動く。

https://www.techno-edge.net/article/2023/04/09/1130.html続きを読む »

高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応（CloseBox） | テクノエッジ TechnoEdge

中国語表記を無理矢理読む必要のあったオープンソースのAI声質変換ソフトウェア「RVC WebUI」が、日本語での表示に対応しました。

https://www.techno-edge.net/article/2023/04/17/1169.html続きを読む »

AIフェイクボイスで対面会話する方法。本人vs.本人AIボイチェンのカオス（CloseBox） | テクノエッジ TechnoEdge

リモートでなく、リアルでAIボイチェンしてみました。

https://www.techno-edge.net/article/2023/04/24/1204.html続きを読む »

最終的にこの手法は岸田首相にまで伝わることになります。

5月：ChatGPTのモバイルアプリ登場

OpenAIのチャットAI「ChatGPT」は、ブラウザベースのサービスなので、モバイルでももちろん使えるのですが、iPhone、Androidのアプリはまだ登場していませんでした。

ChatGPTの公式iPhoneアプリ登場。米国のみだが数週間内には日本でも | テクノエッジ TechnoEdge

OpenAIのChatGPTアプリがiPhoneにやってきました。日本版は数週間のうちに利用可能になるようです。

https://www.techno-edge.net/article/2023/05/19/1311.html続きを読む »

まずは米国版から登場。日本語版も5月26日には使えるようになりました。驚くべきはその音声認識技術。日本語と英語を混在させたものも、ほとんど間違わずに認識できます。これはSiriを大きく上まる出来で、それ以降、ChatGPTアプリを使う頻度は非常に高くなりました。

iOS版ChatGPT公式アプリ、1週間遅れで国内配信。日本語の音声入力も対応 | テクノエッジ TechnoEdge

米国版から1週間遅れで日本のApp StoreでもChatGPT公式アプリがダウンロードできるようになりました。

https://www.techno-edge.net/article/2023/05/26/1342.html続きを読む »

6月：WWDCで期待のAppleGPTは出ず。テレビ出演。西川和久さんのAIグラビア連載スタート

6月といえばWWDCの月。これだけ生成AIが騒がれているのだから何らかの発表があるだろうと期待して書いた予想が完全な大外れとなりました。

・「ChatGPT」アプリの登場で“生成AIとSiriの関係”はどう変わる？　AppleのAI戦略を予想する

その後Appleは地味な論文をちょこちょこ出していて、スモールフットプリントなLLMを使えるようにする方向で動いているのは確かなようなので、予想したところに向かっている気はするのですけどね。

さて、6月は個人的に大きな動きがありました。テレビ出演です。3つのテレビ番組による自宅取材が続けざまにあり、それが放映されることになりました。妻の歌声を再現するテレビ取材は、2021年にNHKにされたことがあり、初めてではありませんが、生成AIブームへの世間の関心の高さはすごいなあと実感しました。その中でも一番長い時間放映された、6月15日放送「News23」の内容に触れた記事がこちら。

生成AIの活用事例としてテレビ報道番組に出演しました。視聴者から寄せられた最大の疑問に答えます（CloseBox） | テクノエッジ TechnoEdge

筆者がテレビ出演時に、生成AIとはまったく関係のないコメントが寄せられました。その疑問に答えます。

https://www.techno-edge.net/article/2023/06/19/1460.html続きを読む »

テレビ放送よりも取材時のフッテージを追加したディレクターズカット版を作ってもらって、それがYouTubeで公開されています。とてもよくまとまっているのでご覧いただければ。

テレビ取材が第一回AIアートグランプリよりもこの時期に集中した理由は、おそらく「ビートルズ最後の新曲」のせい。「音楽、故人、AI」というキーワードに引っかかったのが筆者の事例、ということなんだと理解しました。

ポール・マッカートニー、AIでデモテープからジョン・レノンの歌声を取り出した「ビートルズ最後の新曲」を今年リリース予定と発言 | テクノエッジ TechnoEdge

英国の歌手ポール・マッカートニーが、故ジョン・レノンが残したボーカルを使用した楽曲を現在制作中だと英BBCに語りました。この楽曲は近日の内にリリースされる予定です。

https://www.techno-edge.net/article/2023/06/14/1436.html続きを読む »

そしてここで西川和久さんによる新連載「生成AIグラビアをグラビアカメラマンが作るとどうなる？」がスタート。自分も西川さんの別媒体の記事で勉強していただけに、なんとも実用的な連載スタートに興奮しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる？第一回：実在モデルで学習・LoRAでキャッチライト付加 (西川和久) | テクノエッジ TechnoEdge

ベテランのグラビアカメラマンである西川和久氏がAIグラビア生成を始め、撮影した実在モデルの写真から本人了承のもとトレーニングまでしていると聞き、始めたきっかけやAIとの付き合い方、始めてみたい人へのTIPSをまとめてもらいました。(編集部)

https://www.techno-edge.net/article/2023/07/11/1580.html続きを読む »

7月：新連載「生成AIウィークリー」スタート

で、西川さんの連載に無理やり乗っかっていったコラムも。

妻の写真を学習させたはずなのに出てくるあなたはいったい誰なの？　AI生成グラドル写真集でちょっと考えた（CloseBox） | テクノエッジ TechnoEdge

AIグラビアアイドル写真集「さつきあい」の販売終了のことを考えていたら、AI生成で意図せず生まれてしまった美女たちの行方を考えてしまいました。

https://www.techno-edge.net/article/2023/06/28/1510.html続きを読む »

生成AI用に、超縦長ディスプレイも購入しました。この後でさらに買い足して、現在、3枚の1メートル超級縦型ディスプレイを生成AI画像表示に活用しています。

テレビ取材が自宅に入る。そのために散財した1メートル超縦長ディスプレイと格安デスク（CloseBox） | テクノエッジ TechnoEdge

短期間のうちに3度のテレビ取材を受けた筆者が、そのために購入したものを紹介します。

https://www.techno-edge.net/article/2023/06/26/1494.html続きを読む »

幅1メートル超の32:9ウルトラワイド液晶が最安値。Amazonプライムデーで2台目を。さらに1万円ウルトラワイドも買った（CloseBox） | テクノエッジ TechnoEdge

1メートル超の幅を持つウルトラワイドディスプレイがAmazonプライムセールで最安値をつけています。筆者は2台目を購入しました。

https://www.techno-edge.net/article/2023/07/11/1578.html続きを読む »

そして、7月にはさらなる生成AIの新連載「生成AIウィークリー」が始まります。筆者が前職で編集を担当していた、Seamlessという論文紹介サイトの山下裕毅さんが、毎週月曜日に前週の重要生成AI論文5本をまとめて解説するというもの。「毎日がゲームチェンジャー」な生成AI界隈ですが、そのエッセンスをまとめ読みするのはこの連載が最適です。

「毎日がゲームチェンジャー」の生成AI時代を生き抜くために、1週間分の重要論文をまとめました（新連載・生成AIウィークリー） | テクノエッジ TechnoEdge

1週間分の生成AIに関する重要論文をピックアップして、解説する新連載を、ここにスタートします。

https://www.techno-edge.net/article/2023/07/03/1534.html続きを読む »

8月：AnimateDiff、VALL-E X登場

Tune-A-Videoとはレベル違いのAIアニメーション技術「AnimateDiff」が登場します。一躍話題になり、AUTOMATIC1111でも実装されましたが、Memeplexで簡単に使えるようになったので試してみました。商用ソフトとしてRunwayのGen-2も使えるようになり、AIアニメーションの幅が大きく広がっています。

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ（CloseBox） | テクノエッジ TechnoEdge

最近AnimateDiffというAI動画手法がすごいと各所で注目されています。

https://www.techno-edge.net/article/2023/08/10/1731.html続きを読む »

一方、AI音声合成では2つの大きな動きをレポートしました。まず、ヤマハのVOCALOID。VOCALOIDはすでにAI技術を組み込んでいますが、それとは異なる新しいラインの実験的プロダクトを無償で公開しました。それが、「VOCALOID β-STUDIO」。そのベータ版ユーザーに選ばれたので、試してみた記事も書きました。

期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる（CloseBox） | テクノエッジ TechnoEdge

これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。

https://www.techno-edge.net/article/2023/08/22/1784.html続きを読む »

無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと（CloseBox） | テクノエッジ TechnoEdge

ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。

https://www.techno-edge.net/article/2023/08/25/1801.html続きを読む »

もう一つのAI音声合成技術は、以前マイクロソフトが発表したものの技術の公開は差し控えた「3秒の学習で本人そっくりの音声」を実装してしまった「VALL-E X」。推論に時間がかかるのが難点ですが、実際に使ってみて恐ろしさを感じるほどでした。

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した（CloseBox） | テクノエッジ TechnoEdge

「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。

https://www.techno-edge.net/article/2023/08/28/1812.html続きを読む »

9月：より高度なリップシンク「HeyGen」、欠けた写真を甦らせるPhotoshop Firefly、バーチャルヒューマン

以前紹介したリップシンク技術「D-ID」は、口を開けすぎたり顔が横を向いたときの歪みが不自然だったりと、使い所が難しかったのですが、代替技術が2つ出てきました。一つはオープンソースの「SadTalker」。これはAUTOMATIC1111にも組み込まれているので簡単に使えます。もう一つの「HeyGen」はかなり精度が高く、これならば長尺のリップシンクでも違和感なく見ることができます。これを使って「時をかける少女」カバーを作ってみたという記事です（サムネの鶴書房版書籍はまったく注目されず）。

妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました（CloseBox） | テクノエッジ TechnoEdge

9月はいろいろ個人的なイベントがあります。自分の誕生日と、その前日の結婚記念日がまずあって、まあそれはもう誰も祝う人がいないので一人でケーキを買ってきたり英国リバプールの郷土料理であるスカウスを、クックパッドに残された妻のレシピで作ったりしています。

https://www.techno-edge.net/article/2023/09/04/1848.html続きを読む »

一方で、写真の修復にAIを使う技術も紹介しています。Adobeの生成AI技術であるFirefly。Photoshopの生成AI技術がベータ版ではなく正式版に実装されました。これを使って、妻の顔半分しか残っていない写真を完全なものにするという試み。これがうまくいったのです。驚きでした。

Photoshopに心から感謝を。生成AI「Firefly」が大事な1枚の写真を甦らせてくれました（CloseBox） | テクノエッジ TechnoEdge

この写真は部分的に欠けているけど、残りを見たい。そんな大事な写真をお持ちの方は、Photoshopを使うといいです。

https://www.techno-edge.net/article/2023/09/18/1929.html続きを読む »

バーチャルヒューマンについての動きもまとめました。Epic GamesのMetaHuman Creatorと、Reallusion Character Creator Headshot Pluginについて紹介しています。Headshotによる、3Dプリンタ出力（等身大）も現在手がけています。

実在の人物の3Dバーチャルヒューマン化、生成AIとの組み合わせでうまくいきそう（CloseBox） | テクノエッジ TechnoEdge

生成AIを利用してバーチャルヒューマンを制作してみました。

https://www.techno-edge.net/article/2023/09/25/1975.html続きを読む »

等身大3Dデジタルヒューマンを動かしてみたらインパクトでかかった（CloseBox） | テクノエッジ TechnoEdge

生成AIで学習して生成した顔写真を元に、3Dデジタルヒューマンを作成し、それを等身大のアニメーションにしてみました。

https://www.techno-edge.net/article/2023/09/29/2001.html続きを読む »

フジテレビ「Mr.サンデー」出演のアーカイブが公開されたので、それも貼っておきます（収録・放映は6月）。

10月：「生成AIグラビア実践ワークショップ」始動

10月は自分の原稿を書く余裕がとれず、その代わりに西川和久さん講師の生成AIグラビア実践ワークショップの準備をしていました。「生成AI GO」という、ブラウザでAUTOMATIC1111を使えるサービスを活用しながら、西川さんのプロンプトをすぐに試して保存までできちゃうという画期的な仕組み。筆者は月額1100円を支払っていますが、それが受講中は無料で使えます。ワークショップは毎月1回開催していますが、テクノエッジアルファ会員なら追加料金なしで受講できるというお得なプランなので、これからStable Diffusion勉強したいという人も、上級者のテクニックを知りたいという人もぜひ。

グラビアカメラマンが教える、生成AIグラビア実践ワークショップ（第1回）を開催します | テクノエッジ TechnoEdge

https://www.techno-edge.net/article/2023/10/23/2129.html続きを読む »

11月：OpenAIの変とビートルズ新曲

11月にはOpenAIの開発者向けイベント「DevDay」が開催され、そこでより高性能なLLM「GPT-4 Turbo」、マルチモーダルを進化させた「GPT-4 Turbo with Vision」。さらに、GPTアプリのためのマーケットプレースを発表するなど数々の施策を打ち出しました。その後にはMicrosoftがOpenAIの技術をベースにしたCopilotを全面的に展開する発表を自社イベント「Ignite 2023」で行います。

OpenAIがGPT-4 Turbo発表、従来よりも安価で高性能に。画像入力に特化したGPT-4 Turbo with Visionも | テクノエッジ TechnoEdge

OpenAIは11月6日（米時間）、同社初となる開発者会議「DevDay」にて、生成AIの新モデル「GPT-4 Turbo」を発表しました。

https://www.techno-edge.net/article/2023/11/07/2217.html続きを読む »

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に（Microsoft Ignite 2023） | テクノエッジ TechnoEdge

マイクロソフトはこれまで「Bing Chat」および企業向けに「Bing Chat Enterprise」の呼称で提供してきたAIサービスを「Copilot」にリブランディングし、同社のAIサービス全体の体験を「Microsoft Copilot」で統一します。

https://www.techno-edge.net/article/2023/11/16/2267.html続きを読む »

しかし、その直後にOpenAI内紛が勃発してサム・アルトマン氏がCEOから追放。その後、マイクロソフトの支援を手に幹部社員ともどもMS傘下入りする話や、復帰を望む社員からの署名活動を経て、最終的に出戻ります。

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」 | テクノエッジ TechnoEdge

ChatGPTやDALL・E等の生成AIサービスで知られるOpenAI社が、CEOサム・アルトマン氏の退社を発表しました。

https://www.techno-edge.net/article/2023/11/18/2285.html続きを読む »

マイクロソフト、OpenAIと元OpenAIの両方を手に入れる。OpenAI創業者のアルトマン氏は、マイクロソフトの新しいAI研究チームトップに | テクノエッジ TechnoEdge

マイクロソフトのサティア・ナデラCEOによる投稿で、OpenAIお家騒動は一件落着となりました。

https://www.techno-edge.net/article/2023/11/20/2300.html続きを読む »

サム・アルトマン氏、OpenAIのCEOとして復帰。取締役会も刷新 | テクノエッジ TechnoEdge

先週末にOpenAIから解任された、共同創業者のサム・アルトマン氏がCEOとして復帰することが決まりました。

https://www.techno-edge.net/article/2023/11/22/2317.html続きを読む »

アナウンスされていたビートルズ最後の新曲で、AI技術がどのように使われたかについての解説記事を書きました。

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献（CloseBox） | テクノエッジ TechnoEdge

ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ

https://www.techno-edge.net/article/2023/11/02/2184.html続きを読む »

筆者が初代グランプリを取ったAIアートグランプリの第二回発表があったのもこの月です。快亭木魚さんによるグランプリ作品「明日のあたしのアバタイズ」については、NHKで詳しく記事にしているので、そちらを見るのがいいでしょう（記事にする予定でしたが書けずじまい）。これは発表日の夜に放映されたものをテキスト記事にしたものです。後半では自分への取材内容がまとめられています。

・AIは人間を“拡張”する～アートから見えてきた可能性～（NHK）