生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。
生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演(CloseBox)
テクノエッジのYouTubeチャンネルで、毎週水曜日のお昼に生成AI音楽に関するライブ配信することにしました。名付けて、「AIライブハウス」。いきなりですが、本日(5月1日)正午にスタートです。
自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー)
生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。
アップル、iOS 18の生成AI機能でOpenAI・Google両社と交渉中?自社開発も継続
アップルは次期iOS 18の「いくつかの機能」を生成AIにより強化するため、複数の企業と交渉しているとの噂は、何度か報じられてきたことです。たとえばGoogleとは、Gemini AIの使用に関して協議している、という具合です。
その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した(CloseBox)
10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。
ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議
1996年に死去したラッパーの2PACことトゥパック・シャクールの遺産管理団体が、故人の声をAI生成し、ケンドリック・ラマーへのディス曲「Taylor Made Freestyle」に使ったドレイクに対し、早急に撤回するよう求め、さもなくば訴訟を起こすと警告しています。
Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説(西田宗千佳)
アドビは、4月23日(現地時間)にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか? アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。
手のひら投影型AIデバイス「Humane Ai Pin」で未来っぽい体験を始めた。動画付きファーストインプレッション
サンフランシスコに本社を置くスタートアップ企業、Humaneが開発するAi Pinがようやく手元に届きました。今回はこのAi Pinの第一印象についてレポートします。
米軍、AIドッグファイトに成功。AI自律飛行のX-62A VISTA試験機が有人のF-16との模擬空中戦で防御と攻撃
米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。
Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した
Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。
生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久)
API経由ながらStable Diffusion 3が利用可能に!
作曲AIと架空バンドのミュージックビデオを語るポッドキャスト第51回を配信(TechnoEdge-Side)
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。
生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け
経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。
AI同士が教え合い質を高めるMicrosoft開発オープンLLM「WizardLM-2」、外で撮影した動画→実世界3Dゲームに変換するAI「Video2Game」など重要論文5本を解説(生成AIウィークリー)
オープンソースLLMで大きな動き。MetaがLlama 3を発表したのと同時期に、AI同士が教え合い質を高めるMicrosoft開発オープンLLM「WizardLM-2」を公開。重要論文5本を解説します。
サムスン、生成AI『Galaxy AI』を国内版Galaxy S23やZ Fold 4 / Flip 4にも提供開始。OneUI 6.1アップデート配信
サムスン電子ジャパンは4月18日、国内版GalaxyシリーズにOneUI 6.1へのアップデートを開始しました。
OpenAI日本オフィス誕生で何が変わる?日本語最適化の本当の狙いを読み解く(本田雅一)
4月15日OpenAIの日本オフィス開設が発表された。既に報道されているようにアジアとしては初の拠点、サンフランシスコ以外の拠点としては、英国のロンドン、アイルランドのダブリンに続く3か所めとなる。
Synthesizer Vのメーカーが作った、10秒の音声ファイルがあればリアルタイム歌声変換できるAI技術「Vocoflex」はRVCを超える?(CloseBox)
「年末のライブなんですが、今回、とりちゃんにコーラスをやってもらいたいと思っていて、リアルタイムで歌うことってできないですか?」
生成AIで作られた楽曲の権利はどうなるのか?(AIだけで作った曲を音楽配信する 第2回)
架空プログレッシブバンド「The Midnight Odyssey」の世界デビューから2週間余、様々な動きがありました。本稿では、そのあたりのトピックとAI楽曲の権利の問題について触れていきます。
日常会話や会議を全学習するAIデバイス『Limitlessペンダント』発表。ヒトの知的能力を拡張するパーソナルAI『Limitless』サービス開始
AIスタートアップ企業の Limiteless (リミットレス)が、人の知的能力を拡張し生産性を向上すると謳うPersonalized AIサービス Limitless と、ハードウェア Limitlessペンダントを発表しました。
Adobe、Premiere Proの生成AI機能を先行公開。OpenAI SoraやRunwayのモデルも統合、物体の追加・削除やフレーム生成など
NAB Show 2024にあわせて、Adobeが動画編集アプリ Premiere Pro に追加予定の生成AI機能を先行公開しました。
OpenAI、日本語に最適化したGPT-4カスタムモデル提供。通常のGPT-4 Turboより最大三倍高速、トークン数削減でコスト効率向上
OpenAIが、日本語に最適化したGPT-4カスタムモデルの提供開始を発表しました。
iPhoneとAndroidのUIを理解するAppleの言語モデル「Ferret-UI」、AI生成の“誤ったコード”を自律修正するAI「AutoCodeRover」など重要論文5本を解説(生成AIウィークリー)
今週の生成AI重要論文は、AIが生成した“誤ったコード”を自律修正するAI「AutoCodeRover」、iPhoneのUIを理解するAppleの言語モデル「Ferret-UI」など。
Amazon CEOが重要視する「生成AIのプリミティブなセット」とは何か。見えてきたAWSの生成AI戦略
AmazonのCEOが言うプリミティブなセットとは何か、そしてそれがどのように画期的な顧客体験を実現するのか、などについて公開書簡から紹介していきましょう。
架空バンド「The Midnight Odyssey」のリアルなPVを作る。生成AIをフル活用した世界観の創出と動画制作の手順
生成AIを利用したミュージックビデオ制作に知見のあるテクノロジーライター、大谷和利さんに、実例を使ってその使い方を解説してもらいました。
無料・高品質の作曲AI「Udio」で曲を完成させるまでの手順を動画で解説します(CloseBox)
Udioの操作方法は今ひとつ分かりにくいところもあるようなので、筆者が実際に曲の制作過程を最初から最後まで動画でお見せします。
ChatGPTが一時ダウン、不審なエラーメッセージ吐く。GPT-4 Turbo導入と同時期
日本時間4月11日午前2時過ぎ、OpenAIのAIチャットボット「ChatGPT」の動作がおかしくなったと、複数のユーザーがSNSに問題を報告し始めました。
作曲AIサービスのSuno、Udioなど強力なライバルたち登場のタイミングでプチ改良(CloseBox)
SonautoやUdioといった作曲AI新興勢力の登場が影響したのかどうか、Sunoが改良を加えてきました。
iPhoneでもPixel限定のAI画像編集機能が無料 Googleフォト『消しゴムマジック・編集マジック』他が対応スマホ拡大
Googleは「消しゴムマジック」や「編集マジック」といった Googleフォトの生成AI写真編集機能を、iPhoneや他社のAndroidスマホを含む多数のデバイスに提供拡大します。
AI作曲サービスの新星「Udio」が誰でも利用可能に。Sunoを超えたか、試してみた(CloseBox)
Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
Google、AI動画制作ツール『Google Vids』発表。原稿・絵コンテ・動画編集とAIナレーションまでワンストップの新しいWorkspaceアプリ
Google Cloud Next 2024イベントを前に、Googleが新しいWorkspaceアプリ『Google Vids』を発表しました。
「Suno超えた?」と噂の、リアルな歌声でAI作曲して音源分離もできる「Sonauto」を試してみた(CloseBox)
AIスタートアップのSonautoが運営する同名のAI作曲サービス「Sonauto」がSunoを超えた?と評判です。
第三回AIアートグランプリ開催決定。絵画部門を新設
AIアート作品コンテスト「AIアートグランプリ」の3回目開催が決まりました。第一回は2023年3月、第二回は同年11月に結果発表が行われましたが、第三回は、2024年8月から作品のエントリーを受け付け、最終審査は11月となります。
GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー)
生成AIの重要論文5本を解説する連載。今回は、GPT-4越えで直接スマホ上で処理できるオンデバイス生成AI「Octopus v2」などを取り上げます。
Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox)
Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。
国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
4月11日に、日本版の「Galaxy S24」「Galaxy S24 Ultra」が発売されます。同シリーズは、グーグルの「Gemini」をAIモデルに採用した「Galaxy AI」が最大の特長。Galaxy AIの中でも、筆者が特に注目しているのはボイスレコーダーの文字起こし機能です。
Windows 11の「フォト」にCopilot AI機能が追加、デスクトップ背景の設定やスライドショー作成が可能に。一部ユーザーのみ展開中
Windows 11の一部ユーザーが、標準アプリ「フォト(Photos)」に生成AI機能のCopilotが利用できるようになったと報告しています。
ChatGPTがOpenAIアカウントなしでも利用可能に。段階的に展開
OpenAIは4月1日(現地時間)、チャットAI「ChatGPT」をサインアップ不要で利用可能になると発表しました。「AIの機能に興味のあるすべての人がAIにアクセスできるようにすることを目的として、段階的に展開しています」とのことです。
OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用
OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。
AI歌手はわりとテキトーに歌う。Suno AIの中に住むバーチャルシンガーの人間らしさ(CloseBox)
音楽配信をするときには、必須ではないのですが、歌詞データを用意しておくと、配信サービスが用意した歌詞表示機能が使えるようになります。Apple MusicとSpotifyにはデバイス側で使えるボーカルオフ機能があるので、手軽にカラオケができるというわけです。簡単にできると思ったのですが……。
生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー)
生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。
いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト
出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。
インテル、マイクロソフトのCopilot AIはPCローカルで実行可能になると述べる。次世代NPU搭載プロセッサが前提
マイクロソフトが、まもなくクラウドでなく、PCのローカル環境で実行できるCopilot AIをリリースする模様です。これは、台北で開催されたイベント「Intel AI Summit」における質疑応答でインテル幹部が述べたとのことです。
