AI | テクノエッジ TechnoEdge

テクノロジー 2024 Feb 19

Google、AIでファイル種類を高速正確に判別する「Magika」をオープンソース公開

AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をGoogleがオープンソースで公開。

新野淳一

テクノロジー 2024 Feb 19

1時間超のYouTubeを解釈できるオープンなマルチモーダルAI「LWM」、Windowsをプロンプトで自動操作するMS製AI「UFO」など重要論文5本を解説（生成AIウィークリー）

1週間分の生成AI関連論文の中から重要なものをピックアップする連載。今回は、Gemini 1.5、LoRA改良版、WindowsのAIエージェント、長時間動画にも対応するマルチモーダルAIなど5本を紹介します。

山下裕毅（Seamless）

ガジェット 2024 Feb 18

マルチモーダルAIメガネ『Frame』詳細。39gにOLED画面とカメラ搭載、見たものを翻訳やナビなど。4月出荷で予約受付中

シンガポールのAIデバイス企業 Brilliant Labs が、メガネ型端末「Frame」を発表しました。

Ittousai

テクノロジー 2024 Feb 16

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか

OpenAIから新しい動画生成モデル「Sora」が発表され、合わせて技術レポートも公開されました。Soraはテキストから最長1分の動画を生成できるモデルで、画像から動画の生成や動画の補完も可能。作例を見る限り、現在公開されているどの動画生成モデルよりも優れています。

kogu

テクノロジー 2024 Feb 15

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定

Slackは2月14日（現地時間）、2023年に予告していた生成AI機能「Slack AI」の一般提供を米国と英国にて開始したと発表しました。

山本竜也

テクノロジー 2024 Feb 14

生成AIグラビアをグラビアカメラマンが作るとどうなる？第18回：バレンタイン編。ComfyUIの環境を整える (西川和久)

グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏による生成AI
グラビア実践講座第18回をお届けします

西川和久

テクノロジー 2024 Feb 12

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説（生成AIウィークリー）

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。

山下裕毅（Seamless）

テクノロジー 2024 Feb 11

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む

Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。

Munenori Taniguchi

テクノロジー 2024 Feb 10

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う

米Googleのスンダー・ピチャイCEOは、同社の有料クラウドストレージサービス「Google One」の加入者が1億人を突破したことを発表しました。

Kiyoshi Tane

テクノロジー 2024 Feb 9

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始

Googleは新開発したAIモデルの最高峰「Gemini Ultra」の提供を開始しました。また、対話型AIサービスの名前を「Bard」から「Gemini」に変更します。

Kiyoshi Tane

テクノロジー 2024 Feb 9

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開

アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル（MLLM）を使用しています。

Munenori Taniguchi

テクノロジー 2024 Feb 6

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート

米Amazonは2月2日（現地時間）、ショッピング向けのAIアシスタント「Rufus」を発表しました。米国でAmazonのモバイルアプリを利用する一部ユーザーに対してベータ版が提供開始されており、今後数週間のうちに米国のさらに多くのユーザーに展開されるとのことです。

山本竜也

テクノロジー 2024 Feb 5

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説（生成AIウィークリー）

iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。

山下裕毅（Seamless）

テクノロジー 2024 Feb 5

生成AIおじさんをおじさん好きが作るとどうなる？（第1回）　ありふれたモチーフ「おじさん」を生成するための手法

生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。

kogu

テクノロジー 2024 Feb 3

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応

GoogleのチャットAIサービスBardで、日本語でもGemini Proを利用可能になりました。

山本竜也

ガジェット 2024 Feb 2

「アップルAI」は今年発表へ、クックCEOが明言。WWDCでLLM版 Siri搭載のiOS 18発表？

アップルが未発表製品に関して言及することは、厳しい秘密主義のためか滅多にありません。

Kiyoshi Tane

ガジェット 2024 Jan 31

サムスン、生成AI機能Galaxy AI はS23やZ Fold5 / Flip5 など既存モデルにも提供。有料化は未定

サムスンの最新フラッグシップ・スマートフォンGalaxy S24シリーズでは、生成AIの「Galaxy AI」が大きなセールスポイントとなっています。

Kiyoshi Tane

テクノロジー 2024 Jan 31

生成AIグラビアをグラビアカメラマンが作るとどうなる？第17回：新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)

Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。ところが最近、ComfyUIがちょっとした人気だ。

西川和久

ガジェット 2024 Jan 31

薄型ノートLG gram 2024年モデル国内発表。144Hz VRR対応のgram Pro追加、全機種インテルCore Ultra搭載のAI PC

LGが薄型ノート LG gram シリーズの2024年モデルを国内発表しました。

Ittousai

ガジェット 2024 Jan 30

日本HP、Core Ultra搭載の2 in 1「Spectre x360」＆ゲーミングノート「OMEN」発表。AI PCに先駆けるAIテクノロジー内蔵PC

2024年1月18日、日本HPが2024年度の事業説明会を開始し、同時にCore Ultra搭載のプレミアム2in1「HP Spectre x360 14」、「HP Spectre x360 16」およびゲーミングノートPC「HP Omen Transcend 14」の国内向けの発表を行いました。

石井英男

ガジェット 2024 Jan 30

中国向けGalaxy S24シリーズ、AI機能はGoogleではなく百度の「Ernie 4.0」に。製品ページにもGoogleへの言及なし

サムスンの最新フラッグシップスマートフォン Galaxy S24シリーズは、「Galaxy AI」搭載が特徴のひとつです。それら機能の多くは、Googleの大規模言語モデルGemini Proと画像生成モデル Imagen 2をクラウド経由で活用するもの。しかし、サムスンは中国向けGalaxy S24シリーズにはGeminiではなく、現地企業の百度（Baidu）が開発したAIチャットボット「Ernie 4.0」を採用したことを発表しました。

Kiyoshi Tane

テクノロジー 2024 Jan 29

アーティストのAIへの反発をどう考える？　台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox）

台湾の台北当代芸術館（MoCA TAIPEI）で開催されているAIアート展覧会「你好，人類！Hello, Human!」にアーティストとして参加。この展示会のキュレータにAIとアートの関係について聞いてきました。

松尾公也

テクノロジー 2024 Jan 29

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説（生成AIウィークリー）

今回の生成AI論文解説はいつもより1本多い、6本分です。中でもAmazonのバーチャル試着技術は実用性が高そうです。

山下裕毅（Seamless）

ガジェット 2024 Jan 28

Windows 11がAIノイキャンに標準対応、スマホ写真を即転送など新機能予告。Insider Preview Canary Channelで

マイクロソフトがWindows 11の先行テスト版 Insider Preview Build 20640 (Canary Channel) の新機能を予告しました。

Ittousai

テクノロジー 2024 Jan 24

Google、Chromeのタブ増えすぎ問題をAIで解決。スマートタブ整理やどこでも文例生成など3つの実験AI機能を導入

米Googleはデスクトップ用Chromeブラウザの最新版「M121」をリリースし、実験的な生成AI機能を3つ導入すると発表しました。

Kiyoshi Tane

テクノロジー 2024 Jan 22

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説（生成AIウィークリー）

PhotoMakerのライバルともいうべき技術やAppleのLLMなど、生成AI最新論文の概要5つを紹介します。

山下裕毅（Seamless）

テクノロジー 2024 Jan 21

生成AIグラビアをグラビアカメラマンが作るとどうなる？第16回：指問題解決！？Hand Refiner (西川和久)

Hand Refinerは2023年12月1日に論文、その後、2024年1月初旬にAUTOMATIC1111のADetailerとComfyUIで使用可能になった手(指)に関する新手法だ。今回ご紹介するHand Refinerはかなりロジカル。具体的には、画像から手を認識、認識した位置での形や5本指などリファレンスになる手を深度情報で取得、その深度情報を使って手をInpaintする、ざっくりこの3段構えとなる。

西川和久

テクノロジー 2024 Jan 19

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える

PC向けゲーム配信プラットフォーム最大手のSteamがAIコンテンツについての新たな方針を発表しました。生成AIを用いて作られた大半のゲームを受け入れるという大きな変更です。

kogu

ガジェット 2024 Jan 18

Galaxy S24シリーズ実機ハンズオン。AI全面採用で翻訳や文字起こし、画像編集機能が強化。ニアバイシェアはクイック共有に（石野純也）

サムスン電子は、1月17日（現地時間）に米カリフォルニア州サンノゼで、製品紹介イベントの「Galaxy Unpacked」を開催。24年のフラッグシップモデルとなる「Galaxy S24」「Galaxy S24+」「Galaxy S24 Ultra」の3機種を発表しました。短時間ではありますが、この3モデルに触れることができたので、ここではそのレポートをお届けします。

石野純也

テクノロジー 2024 Jan 17

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた（CloseBox）

最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。

松尾公也

テクノロジー 2024 Jan 16

マイクロソフト、個人向け生成AIサブスク「Copilot Pro」提供開始。Officeアプリでも利用可能、月額3200円

Microsoftは1月15日（現地時間）、生成AIサービス「Copilot」の個人向けサブスクリプションサービス「Copilot Pro」を発表、提供を開始しました。

山本竜也

テクノロジー 2024 Jan 15

Animate Anyoneのオープンソース再現実装版が登場、GPT-4の次に性能が高い商用利用可能な新AIモデル「Mixtral 8x7B」など重要論文を解説（生成AIウィークリー）

今回は生成AI論文解説に加え、2つの興味深い実装も紹介しています。

山下裕毅（Seamless）

ゲーム 2024 Jan 12

『プリンス・オブ・ペルシャ』新作、うっかり一部NPCの音声収録を忘れる。読上げソフトの仮音声のまま発売へ

Ubisoftが1月15日(日本は18日)に発売する、新作ゲーム『プリンス・オブ・ペルシャ失われた王冠』のなかで、一部NPC(Nom Player Character)のセリフが、テキスト読み上げソフトによる仮の音声のままリリース版に含まれてしまっていることがわかりました。

Munenori Taniguchi

テクノロジー 2024 Jan 11

OpenAIがGPT Store開設、早速「SEOブログ記事自動生成」「AI検出回避に人間らしく加工」等が人気。レベニューシェア収益化も

OpenAIが、かねてから予告していたGPT Store をようやく開設しました。

Ittousai

テクノロジー 2024 Jan 11

矢印を書き込んで動きを制御できる動画生成AI「DragNUWA」使いかたと注意点

生成AIにより静止画に動きを与える技術がいくつか出てきましたが、求める動きを出すのはなかなか難しいものがあります。今回紹介する「DragNUWA」は、そんな弱点を補ってくれるユーザーインタフェースを備えています。

kogu

テクノロジー 2024 Jan 10

モバイルAI端末rabbit r1発表。ウサギAIがアプリを代わりに操作してくれるコンシェルジュ的デバイス

AIハードウェアスタートアップのrabbitが、モバイルAI端末rabbit r1を発表しました。
様々なアプリやサービスを学習したAIが、ユーザーの指示に応えてかわりに操作して用事を済ませてくれる、執事かコンシェルジュのような発想の製品です。

Ittousai

テクノロジー 2024 Jan 9

「你好，人類！Hello, Human!」という台湾のAIアート展覧会に参加します（CloseBox）

台湾の現代アート美術館で、筆者のAI作品が展示されることになりました。

松尾公也

テクノロジー 2024 Jan 8

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説（生成AIウィークリー）

感情を含む細かい表現が可能なAIボイスクローン技術「OpenVoice」など、生成AI最新論文の概要5つをお届けします。

山下裕毅（Seamless）

テクノロジー 2024 Jan 1

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説（生成AIウィークリー）

「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの生成AI論文を紹介します。

山下裕毅（Seamless）

テクノロジー 2023 Dec 31

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」

トランプ政権において、大統領の個人弁護士兼フィクサーとして活動したマイケル・コーエン氏が、12月はじめに裁判所に提出した公式書類に存在しない判例を記していたことを裁判所から追求され、それがAIで生成したものであることを認めました。

Munenori Taniguchi

ガジェット 2023 Dec 31

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も

マイクロソフトはApp StoreでiOS/iPadOS用の「Microsoft Copilot」アプリを配信開始しました。少し前に、Android版アプリも公開されています。

Kiyoshi Tane

テクノロジー 2023 Dec 29

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る（CloseBox）

2023年（のちょっと前から）の生成AIの動きというか広がり、勢いを、自分の取り組みを中心にまとめてみました。

松尾公也

AI

Google、AIでファイル種類を高速正確に判別する「Magika」をオープンソース公開

1時間超のYouTubeを解釈できるオープンなマルチモーダルAI「LWM」、Windowsをプロンプトで自動操作するMS製AI「UFO」など重要論文5本を解説（生成AIウィークリー）

マルチモーダルAIメガネ『Frame』詳細。39gにOLED画面とカメラ搭載、見たものを翻訳やナビなど。4月出荷で予約受付中

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定

生成AIグラビアをグラビアカメラマンが作るとどうなる？第18回：バレンタイン編。ComfyUIの環境を整える (西川和久)

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説（生成AIウィークリー）

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説（生成AIウィークリー）

生成AIおじさんをおじさん好きが作るとどうなる？（第1回） ありふれたモチーフ「おじさん」を生成するための手法

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応

「アップルAI」は今年発表へ、クックCEOが明言。WWDCでLLM版 Siri搭載のiOS 18発表？

サムスン、生成AI機能Galaxy AI はS23やZ Fold5 / Flip5 など既存モデルにも提供。有料化は未定

生成AIグラビアをグラビアカメラマンが作るとどうなる？第17回：新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)

薄型ノートLG gram 2024年モデル国内発表。144Hz VRR対応のgram Pro追加、全機種インテルCore Ultra搭載のAI PC

日本HP、Core Ultra搭載の2 in 1「Spectre x360」＆ゲーミングノート「OMEN」発表。AI PCに先駆けるAIテクノロジー内蔵PC

中国向けGalaxy S24シリーズ、AI機能はGoogleではなく百度の「Ernie 4.0」に。製品ページにもGoogleへの言及なし

アーティストのAIへの反発をどう考える？ 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox）

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説（生成AIウィークリー）

Windows 11がAIノイキャンに標準対応、スマホ写真を即転送など新機能予告。Insider Preview Canary Channelで

Google、Chromeのタブ増えすぎ問題をAIで解決。スマートタブ整理やどこでも文例生成など3つの実験AI機能を導入

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第16回：指問題解決！？Hand Refiner (西川和久)

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える

Galaxy S24シリーズ実機ハンズオン。AI全面採用で翻訳や文字起こし、画像編集機能が強化。ニアバイシェアはクイック共有に（石野純也）

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた（CloseBox）

マイクロソフト、個人向け生成AIサブスク「Copilot Pro」提供開始。Officeアプリでも利用可能、月額3200円

Animate Anyoneのオープンソース再現実装版が登場、GPT-4の次に性能が高い商用利用可能な新AIモデル「Mixtral 8x7B」など重要論文を解説（生成AIウィークリー）

『プリンス・オブ・ペルシャ』新作、うっかり一部NPCの音声収録を忘れる。読上げソフトの仮音声のまま発売へ

OpenAIがGPT Store開設、早速「SEOブログ記事自動生成」「AI検出回避に人間らしく加工」等が人気。レベニューシェア収益化も

矢印を書き込んで動きを制御できる動画生成AI「DragNUWA」使いかたと注意点

モバイルAI端末rabbit r1発表。ウサギAIがアプリを代わりに操作してくれるコンシェルジュ的デバイス

「你好，人類！Hello, Human!」という台湾のAIアート展覧会に参加します（CloseBox）

他言語で感情表現も可能な音声クローンAI「OpenVoice」、対談音声から動き付きリアルアバター生成するAIモデルなど重要論文5本を解説（生成AIウィークリー）

GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説（生成AIウィークリー）

元トランプ大統領の個人弁護士、Google Bard生成のニセ判例を提出して追求受ける「本物のような文章を生成するサービスとは知らなかった」

マイクロソフト、iPhone / iPad版Copilotアプリ配信開始。無料でGPT-4も利用可能、画像生成や図で説明も

画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る（CloseBox）

生成AIおじさんをおじさん好きが作るとどうなる？（第1回）　ありふれたモチーフ「おじさん」を生成するための手法

アーティストのAIへの反発をどう考える？　台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox）