
「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox)
人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。

OpenAIアドベントカレンダーこと「12 Days of OpenAI」、スタート。Day 1はChatGPT Pro(月額200ドル)とo1完全版(CloseBox)
OpenAIアドベントカレンダーこと「12 Days of OpenAI」、が始まりました。初日はChatGPT Pro(月額200ドル)とo1完全版を発表しました。

「写真はイメージです」を撲滅したいので、Gemini LiveとChatGPTとおしゃべりして解決策を探った(CloseBox)
GeminiとChatGPTに、「写真はイメージです」という表現の代替案を考えてもらいました。

「生成AI vs. 著名な詩人」どっちの詩が好き? シェイクスピアやディキンソンなどとAI詩を比較(生成AIクローズアップ)
AIが生成した詩と詩人による作品とが区別できるのか、またどちらが好まれるかを調査した論文「AI-generated poetry is indistinguishable from human-written poetry and is rated more favorably」に注目します。

ChatGPT searchはGoogle検索の脅威となるか? 試してわかったこと(Google Tales)
OpenAIがSearchGPTの提供を開始したことが、すわGoogle検索キラーの本命か、とかなり話題になっておりました。Googleも、かなり危機感を持っていると思います。

TSMCも頼る、コンピュータの守護スナック「乖乖」。AIを組み合わせると何が起こる?(CloseBox)
台湾には「乖乖」(Quai Quai)というスナック菓子があります。TSMCをはじめとする台湾企業は世界のコンピュータ産業の中核をなしていますが、彼らがこの乖乖を機械の守護神として扱っているのはご存知でしょうか?

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)
これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)
AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

Notihng、初のオープン型イヤホン「Ear (open) 」正式発表。ChatGPT連携も対応、2万4800円
英国のテクノロジーブランドNothingは、フルワイヤレスイヤホンの新製品「Ear (open) 」を発表しました。税込価格は2万4800円となっています。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)
OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第57回)では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI(11.6億パラメータ)の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox)
音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

OpenAI、独自検索エンジン「SearchGPT」公開。招待制の期間限定試作、ChatGPTと統合へ
OpenAIが、うわさの独自検索エンジン「SearchGPT Prototype」の試験運用を開始しました。

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる(CloseBox)
このところプログラミングの楽しみを覚えて毎日Claude ArtifactsとChatGPT Artifactsで遊んでいる筆者ですが、またまた新しいツールに出会ってしまいました。

ChatGPT Artifactsができた? GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ(CloseBox)
大規模言語モデルのClaudeが送り出した新機能、Artifactsを使った記事が思いのほか好評のようですが、問題が一つ。使用量制限がかかってしまい、次のアクションまで数時間待たされることが頻発しているのです。

Apple Intelligenceはどのように開発されたのか? 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること(CloseBox)
アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。

本来あるべきSiri、AIを統合したOS。Apple Intelligenceの未来を見た僕がCopilot+ PCの検討を始めた理由(CloseBox)
アップルの開発者会議「WWDC24」基調講演の後半は、主要プラットフォームへの生成AI統合の話に終始しましたが、日本では来年になるまで使えません。

アップルのAI『Apple Intelligence』まとめ。ChatGPTもOS統合 iPhone 15 ProかM1以降必須
開発者イベントWWDC24で、Appleがうわさの独自AIシステム『Apple Intelligence』を発表しました。

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox)
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

GPT-4o vs. Project Astra。マルチモーダルLLM戦争を語るポッドキャスト第55回を配信(TechnoEdge-Side)
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化
中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明
ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能
OpenAIはChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開した。

OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も
OpenAIは5月13日(米国時間)、オンラインでSpring Updateイベントを開催。その中で、フラグシップとなる大規模言語モデル「GPT-4o」を発表しました。APIでの提供も行い、現行のGPT-4 Turboと比べて2倍高速、価格は50%安価に、レートリミットは5倍に拡張されています。

OpenAI日本オフィス誕生で何が変わる?日本語最適化の本当の狙いを読み解く(本田雅一)
4月15日OpenAIの日本オフィス開設が発表された。既に報道されているようにアジアとしては初の拠点、サンフランシスコ以外の拠点としては、英国のロンドン、アイルランドのダブリンに続く3か所めとなる。

OpenAI、日本語に最適化したGPT-4カスタムモデル提供。通常のGPT-4 Turboより最大三倍高速、トークン数削減でコスト効率向上
OpenAIが、日本語に最適化したGPT-4カスタムモデルの提供開始を発表しました。

ChatGPTが一時ダウン、不審なエラーメッセージ吐く。GPT-4 Turbo導入と同時期
日本時間4月11日午前2時過ぎ、OpenAIのAIチャットボット「ChatGPT」の動作がおかしくなったと、複数のユーザーがSNSに問題を報告し始めました。

ChatGPTがOpenAIアカウントなしでも利用可能に。段階的に展開
OpenAIは4月1日(現地時間)、チャットAI「ChatGPT」をサインアップ不要で利用可能になると発表しました。「AIの機能に興味のあるすべての人がAIにアクセスできるようにすることを目的として、段階的に展開しています」とのことです。

AI歌手はわりとテキトーに歌う。Suno AIの中に住むバーチャルシンガーの人間らしさ(CloseBox)
音楽配信をするときには、必須ではないのですが、歌詞データを用意しておくと、配信サービスが用意した歌詞表示機能が使えるようになります。Apple MusicとSpotifyにはデバイス側で使えるボーカルオフ機能があるので、手軽にカラオケができるというわけです。簡単にできると思ったのですが……。

新連載「AIだけで作った曲を音楽配信する」。生成AIが作り上げた架空バンド「The Midnight Odyssey」を世界デビューさせる、その裏側
大規模言語モデル(LLM)でコンセプトを考えて、AI作曲サービスでボーカル入り楽曲を作り出す。そんなやり方で制作したコンセプトアルバムを音楽配信に載せるという話を、自ら音楽レーベルを主宰し、テクノロジー関連の執筆もこなしている山崎潤一郎さんに、数回にわたって執筆いただきます。

ゲーム内の「村人のセリフ」をChatGPTで大量生成する方法(第2回)。データを大量に出力する
生成AIをゲーム開発の現場で活用している筆者が、ゲーム内テキストの作成、中でもいわゆるRPGの村人たちのセリフの生成を一から行う流れを解説します。第2回は、データを大量に作るところから改善すべき点まで。

「GPTs」で自分向け推敲支援機能を作ってみる(西田宗千佳)
ChatGPTの機能を使い、「自分向けの推敲支援機能」を作ってみた。

ゲーム内の「村人のセリフ」をChatGPTで大量生成する方法(第1回)。RPG村人が住む世界を作るまで
ChatGPTがこれほど広く雑多な目的に適用できるのは未だ驚きです。このままいわゆるAGIに到達する道にあるのか、規制や資源の問題はどうなるのか、未来への関心は尽きませんが目の前の実用も重要です。

天の川銀河の中心を指し示すiPhoneアプリ『Galactic Compass』公開。開発者はChatGPTの助けを借りて制作
デザイナーのマット・ウェッブ氏は先週木曜日、天の川銀河の中心を矢印で指し示す、無料のiPhone向けARアプリ『Galactic Compass』をApp Storeに公開しました。

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox)
Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す?Google DeepMind研究者らのチームが論文発表
Google DeepMindや複数の大学の研究者からなるチームが、AI企業に対し、単純な攻撃がプライバシー関連の問題を起こす可能性があるとして、大規模言語モデル(LLM)をリリースする前に内部や第三者による安全性テストを実施するよう求めています。

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め
OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。

Anker、ChatGPTで喋るペットロボ「Loona Blue」12月発売。予約先着1000台は20%オフ
Anker Japanが、ペットロボットの日本における販売を担うグループ子会社ルーナ・ジャパンを設立。ペットロボット「Loona Blue」を12月上旬に発売するとして予約を開始しました。価格は8万9990円ですが、予約期間中は20%オフの7万1990円となっています(1000台限定)。

ChatGPT、画像と音声使った会話が可能に。Plusユーザーはモバイルアプリでマルチモーダルに
OpenAIは9月25日、ChatGPTのバージョンアップを発表しました。今後2週間でロールアウトし、Plusプランのユーザーは、iOSとAndroidアプリではChatGPTと音声で会話することが可能になり、画像を含んだ会話ができるようになります。

AI画像生成ツール「DALL・E 3」発表。ChatGPTとの統合で対話的に生成し、プロンプトの理解度向上も
OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。

OpenAI、Android版ChatGPT公式アプリ配信開始。日本向けは事前登録中
OpenAIは7月26日、ChatGPTのAndroid版をリリースしました。現在、米国、インド、バングラデシュ、ブラジルでダウンロード可能となっており、来週以降さらに多くの国への展開を予定しているとのことです。

Android版ChatGPTアプリは来週配信、OpenAIが告知「GPT-4の頭が劣化」指摘にも回答
OpenAIが、Android版のChatGPTアプリを来週リリースするとツイートしました。iOS版は5月にリリースされ、当時Android版については「まもなく」とアナウンスしていましたが、感覚的にはわりと長い間が開いてのリリースとなります。