AI | テクノエッジ TechnoEdge

テクノロジー 2024 May 25

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox）

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

松尾公也

テクノロジー 2024 May 24

GPT-4o vs. Project Astra。マルチモーダルLLM戦争を語るポッドキャスト第55回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 May 23

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供

Minecraftをプレイするときに、AIアシスタント「Copilot」と会話できる機能をMicrosoftが発表しました。21日にSNSで公開された映像では、プレイヤーがCopilotにアイテム制作のアドバイスを求めたり、Copilotが脅威への対処法を知らせる様子が映されています。

関根慎一

テクノロジー 2024 May 23

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中？発売から約1か月（Bloomberg報道）

Humaneは2023年11月、同社の最初で唯一の製品であるAI Pinを発表、2024年4月に出荷を開始し始めたばかりでしたが、新しい報道によると現在、会社の売却を検討しているとのことです。

Munenori Taniguchi

テクノロジー 2024 May 23

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

中国国家サイバースペース管理局（CAC）は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル（LLM）を搭載するAIシステムを開発しました。

Munenori Taniguchi

テクノロジー 2024 May 22

生成AIグラビアをグラビアカメラマンが作るとどうなる？第25回：三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)

現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第25回は、画像生成と切っても切り離せないアップスケールの新技術編。

西川和久

テクノロジー 2024 May 22

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明

ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

Munenori Taniguchi

ガジェット 2024 May 22

クアルコム、Snapdragon X Elite搭載のMac mini風ミニデスクトップPCを発表。ARM版Windowsアプリ開発向け

クアルコムは、マイクロソフトが発表した新しいSurfaceシリーズにも採用されているSnapdragon X Elite搭載のWindowsミニデスクトップPCを発表しました。価格は899ドル（約14万円）で、6月18日発売予定です。

Munenori Taniguchi

テクノロジー 2024 May 20

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説（生成AIウィークリー）

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。

山下（Seamless）

テクノロジー 2024 May 17

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

Googleは5月14日～15日（現地時間）、年次開発者会会議Google I/Oを開催しました。直前にPixel 8aが発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーが身近に感じられそうなのがGemini Advancedのアップデートでしょう。

山本竜也

テクノロジー 2024 May 17

技術書典16に出展『グラビアカメラマンが教える生成AIグラビア実践ハンドブック』を制作しました

テクノエッジは、5月25日から6月9日にかけてオンラインおよびオフラインで開催されるイベント「技術書典16」に出展します。

テクノエッジ編集部

テクノロジー 2024 May 17

成功させたいスタートアップの条件とは？　エンジェル投資家川崎裕一さんゲストの第54回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 May 15

Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作

Googleは年次開発者会議「Google I/O」にて、Androidスマートフォンに掛かってきた電話が詐欺の疑いがある場合、ユーザーに警告する機能をテスト中だと発表しました。

Kiyoshi Tane

テクノロジー 2024 May 15

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」？

日本時間5月15日午前2時より開催されたGoogle I/Oより。Googleは今回のイベントで、Gemini AIをさらに多様なプロダクトに組み込んでいることを大きくアピールしました。

Munenori Taniguchi

テクノロジー 2024 May 15

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も

5月15日の Google I/O基調講演で、Googleが新たな動画生成AIモデル『Veo』を発表しました。

Ittousai

テクノロジー 2024 May 15

Logic Pro 11の新機能を試して理解した、AI作曲と楽器パート別音源分離「Stem Splitter」の相性（CloseBox）

Logic ProのMac版であるバージョン11とiPad版のバージョン2が、5月14日に更新されました。本当に10年待ったぜ、という感じのSession Players、AI作曲時代にぴったりのStem Splitterなど、大きな新機能が入った新版です。

松尾公也

テクノロジー 2024 May 14

生成AIグラビアをグラビアカメラマンが作るとどうなる？第24回：照明を自由にコントロールできるIC-Light登場！(西川和久)

lllyasviel氏復活第一弾のIC-Light

西川和久

テクノロジー 2024 May 14

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能

OpenAIはChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開した。

松尾公也

テクノロジー 2024 May 13

Appleイベント直前、告知満載の第53回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 May 13

アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

新野淳一

テクノロジー 2024 May 13

Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5本を解説する連載。Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など。

山下（Seamless）

ガジェット 2024 May 9

新型 iPad Proを忘れて、純粋にSoCとしてのM4と「その先」について考えてみる（本田雅一）

アップルがニューヨーク、ロンドン、上海で開催した、iPadをメインに据えた久々の発表会。 製品の概要については、既に十分な報道がなされている上、ウェブにも大量の情報が溢れている。近いうちに実機でのテストの機会があるため、ここでは少し製品から離れて、新型iPad Proに搭載されている新しいプロセッサについて話を進めていくことにしたい。

本田雅一

テクノロジー 2024 May 9

AI作曲のUdio、有料サービス開始。部分修正も可能に（CloseBox）

AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。

松尾公也

テクノロジー 2024 May 8

Logic Proが無料の大幅更新、ベース・キーボードもコード進行に合わせて自動演奏。あとはギター弾いて歌うだけ（CloseBox）

アップルは5月7日、音楽制作ソフトLogic Proの機能アップを発表しました。

松尾公也

テクノロジー 2024 May 7

作曲AIはプログレッシブロックの夢を見るか？　Udioが長く一貫性のある曲を作れるようになった理由（CloseBox）

作曲AIサービスのUdioが5月1日、新機能を搭載したとX上で発表しました。長く、一貫性のある曲を作れるようになると謳っています。この新機能を使ってプログレの長い曲を作ってみました。

松尾公也

テクノロジー 2024 May 7

世界デビューした生成AI架空バンドの曲を人力カバー、AIが語る音楽性を人間が再現。カバーしてくれる人を募集します（AIだけで作った曲を音楽配信する　第2回）

AIが創造したプログレバンド「The Midnight Odyssey」が世界デビューしてから1カ月が過ぎました。バンドは勢力的に活動しているようで、リードギターのエリオット・スミスがリモートでインタビューに応じた映像が飛び込んできました。

山崎潤一郎

テクノロジー 2024 May 7

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集

動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、（おそらく）世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。

大谷和利

テクノロジー 2024 May 2

Google、新AIアシスタント Gemini モバイルアプリを日本でも提供開始。Googleアシスタントを置き換え

Googleは4月30日（現地時間）、Geminiモバイルアプリの提供地域を拡大すると発表しました。日本でもAndroidではGoogle Playストアからダウンロードが可能。iOSの場合は専用アプリはなく、Googleアプリからのアクセスとなります。

山本竜也

テクノロジー 2024 May 2

Anthropic、生成AI『Claude』の公式 iOSアプリ配信。Teamプランも提供開始

Anthropicは5月1日（現地時間）、生成AI「Claude（クロード）」のiOSアプリをリリースしました。あわせて、新プランとなる「Team」も発表されています。

山本竜也

テクノロジー 2024 May 1

生成AIグラビアをグラビアカメラマンが作るとどうなる？第23回：Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)

グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。

西川和久

テクノロジー 2024 May 1

生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演（CloseBox）

テクノエッジのYouTubeチャンネルで、毎週水曜日のお昼に生成AI音楽に関するライブ配信することにしました。名付けて、「AIライブハウス」。いきなりですが、本日（5月1日）正午にスタートです。

松尾公也

テクノロジー 2024 Apr 29

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。

山下（Seamless）

ガジェット 2024 Apr 28

アップル、iOS 18の生成AI機能でOpenAI・Google両社と交渉中？自社開発も継続

アップルは次期iOS 18の「いくつかの機能」を生成AIにより強化するため、複数の企業と交渉しているとの噂は、何度か報じられてきたことです。たとえばGoogleとは、Gemini AIの使用に関して協議している、という具合です。

Kiyoshi Tane

テクノロジー 2024 Apr 28

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した（CloseBox）

10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。

松尾公也

テクノロジー 2024 Apr 26

ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議

1996年に死去したラッパーの2PACことトゥパック・シャクールの遺産管理団体が、故人の声をAI生成し、ケンドリック・ラマーへのディス曲「Taylor Made Freestyle」に使ったドレイクに対し、早急に撤回するよう求め、さもなくば訴訟を起こすと警告しています。

Munenori Taniguchi

テクノロジー 2024 Apr 23

Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説（西田宗千佳）

アドビは、4月23日（現地時間）にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか？アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。

西田宗千佳

テクノロジー 2024 Apr 22

手のひら投影型AIデバイス「Humane Ai Pin」で未来っぽい体験を始めた。動画付きファーストインプレッション

サンフランシスコに本社を置くスタートアップ企業、Humaneが開発するAi Pinがようやく手元に届きました。今回はこのAi Pinの第一印象についてレポートします。

五島正浩

テクノロジー 2024 Apr 22

米軍、AIドッグファイトに成功。AI自律飛行のX-62A VISTA試験機が有人のF-16との模擬空中戦で防御と攻撃

米国空軍テストパイロットスクールと国防高等研究計画局は（DARPA）、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機（VISTA）を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。

Munenori Taniguchi

テクノロジー 2024 Apr 22

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した

Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。

kogu

テクノロジー 2024 Apr 22

生成AIグラビアをグラビアカメラマンが作るとどうなる？　第22回：Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成（西川和久）

API経由ながらStable Diffusion 3が利用可能に！

西川和久

テクノロジー 2024 Apr 22

作曲AIと架空バンドのミュージックビデオを語るポッドキャスト第51回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 Apr 22

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け

経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。

新野淳一

AI

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に（CloseBox）

GPT-4o vs. Project Astra。マルチモーダルLLM戦争を語るポッドキャスト第55回を配信（TechnoEdge-Side）

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中？発売から約1か月（Bloomberg報道）

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

生成AIグラビアをグラビアカメラマンが作るとどうなる？第25回：三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明

クアルコム、Snapdragon X Elite搭載のMac mini風ミニデスクトップPCを発表。ARM版Windowsアプリ開発向け

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説（生成AIウィークリー）

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

技術書典16に出展『グラビアカメラマンが教える 生成AIグラビア実践ハンドブック』を制作しました

成功させたいスタートアップの条件とは？ エンジェル投資家 川崎裕一さんゲストの第54回を配信（TechnoEdge-Side）

Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」？

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も

Logic Pro 11の新機能を試して理解した、AI作曲と楽器パート別音源分離「Stem Splitter」の相性（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第24回：照明を自由にコントロールできるIC-Light登場！(西川和久)

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能

Appleイベント直前、告知満載の第53回を配信（TechnoEdge-Side）

アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援

Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説（生成AIウィークリー）

新型 iPad Proを忘れて、純粋にSoCとしてのM4と「その先」について考えてみる（本田雅一）

AI作曲のUdio、有料サービス開始。部分修正も可能に（CloseBox）

Logic Proが無料の大幅更新、ベース・キーボードもコード進行に合わせて自動演奏。あとはギター弾いて歌うだけ（CloseBox）

作曲AIはプログレッシブロックの夢を見るか？ Udioが長く一貫性のある曲を作れるようになった理由（CloseBox）

世界デビューした生成AI架空バンドの曲を人力カバー、AIが語る音楽性を人間が再現。カバーしてくれる人を募集します（AIだけで作った曲を音楽配信する 第2回）

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集

Google、新AIアシスタント Gemini モバイルアプリを日本でも提供開始。Googleアシスタントを置き換え

Anthropic、生成AI『Claude』の公式 iOSアプリ配信。Teamプランも提供開始

生成AIグラビアをグラビアカメラマンが作るとどうなる？第23回：Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)

生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演（CloseBox）

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説（生成AIウィークリー）

アップル、iOS 18の生成AI機能でOpenAI・Google両社と交渉中？自社開発も継続

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した（CloseBox）

ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議

Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説（西田宗千佳）

手のひら投影型AIデバイス「Humane Ai Pin」で未来っぽい体験を始めた。動画付きファーストインプレッション

米軍、AIドッグファイトに成功。AI自律飛行のX-62A VISTA試験機が有人のF-16との模擬空中戦で防御と攻撃

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した

生成AIグラビアをグラビアカメラマンが作るとどうなる？ 第22回：Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成（西川和久）

作曲AIと架空バンドのミュージックビデオを語るポッドキャスト第51回を配信（TechnoEdge-Side）

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け

技術書典16に出展『グラビアカメラマンが教える生成AIグラビア実践ハンドブック』を制作しました

成功させたいスタートアップの条件とは？　エンジェル投資家川崎裕一さんゲストの第54回を配信（TechnoEdge-Side）

作曲AIはプログレッシブロックの夢を見るか？　Udioが長く一貫性のある曲を作れるようになった理由（CloseBox）

世界デビューした生成AI架空バンドの曲を人力カバー、AIが語る音楽性を人間が再現。カバーしてくれる人を募集します（AIだけで作った曲を音楽配信する　第2回）

生成AIグラビアをグラビアカメラマンが作るとどうなる？　第22回：Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成（西川和久）