[go: up one dir, main page]

タグ

生成AIに関するyamadarのブックマーク (158)

  • 「責任あるAI」に価値を見いだす消費者--デロイトの最新調査で明らかに

    Deloitteの調査によると、米国の消費者はAIチャットボットを生活に積極的に取り入れており、この技術に対して比較的好意的な見方をしていることが分かった。また、この調査では、消費者がAIツールへの支払い意欲を示すかどうかは、そのツールのベンダーが革新的で信頼できると認識されているかどうかにかかっていることも明らかになった。 この点について、主執筆者であるSteve Feinberg氏と共同研究者らは、Deloitteが実施した第6回年次米国消費者調査「2025 Connected Consumer Survey」で、「消費者がパーソナライズされたデジタル体験に深く入り込むにつれて、特にプライバシーとセキュリティに関して、トレードオフを評価し始めている」と述べている。 Feinberg氏らは、「今回の調査で回答した消費者の過半数、具体的には53%が現在、生成AIを試用しているか、または定期

    「責任あるAI」に価値を見いだす消費者--デロイトの最新調査で明らかに
    yamadar
    yamadar 2025/10/07
    そりゃそうだよな
  • Google公式の Nano Banana プロンプトテンプレートが参考になったので試してみた

    これはなに? Google AI Studio が以下のX投稿で Nano Banana 向けのプロンプトテンプレートを公開していました。 個人的に画像生成のPromptingはあまり経験がなく、写経しながら試してみたところ「こんなに詳しく書かないとまともな絵が出てこないのね」と勉強になったので備忘録としてメモを残します📝 以下、ガイドに書かれていた原則、および、日語で試す際の注意点に少し触れたのち、プロンプトテンプレートの日語版とそれを実際に僕が試した事例の紹介へと進みます。 プロンプトテンプレートはわかりやすく日語に翻訳してありますが、多少意訳しているため正確な翻訳ではないことにご留意ください。 前提条件 覚えておくべき原則 ガイドではプロンプトテンプレートの話に入る前に "原則" が紹介されていました。端的に言うと「描いてほしい内容をなるべく詳しく伝えろ」ってことですね。 キ

    Google公式の Nano Banana プロンプトテンプレートが参考になったので試してみた
  • Vivaldi、立場を表明:人間のブラウジングのために | Vivaldi Browser

    社会と同様、ウェブも人間が思考を重ね、比較し、自らが何かを発見することで進化します。Vivaldi はブラウジングという行為は能動的であるべきだと考えています。ブラウジングは、探索し、疑問を投げかけ、自分自身の判断を下すという行為です。 業界を見回すと、人工的なアシスタントがブラウザに直接埋め込まれるようになっており、答えを得るための近道のように提案されています。Google はページの内容を要約するために Chrome に Gemini を組み込んでいますが、ごく近い将来、ユーザーの代わりにタブを操作し、サイトをナビゲートする機能も追加されるでしょう。Microsoft は画面に表示される内容をスキャンし、ユーザーの行動を予測する新しいモードを含む AI ブラウザとしての Edge を推進しています。 このような動きは、アドレスバーを単なる AI への指示入力欄とし、ユーザーの探索する喜

    Vivaldi、立場を表明:人間のブラウジングのために | Vivaldi Browser
    yamadar
    yamadar 2025/08/30
    『ブラウザ戦争の次の段階は、タブの読み込み速度に関するものではなく、誰が知識を仲介し、誰が利益を得て、誰が情報へのアクセス経路を支配し、誰がユーザーを収益化できるか、という点にシフトしています』
  • AIに「作品ではなく作風が盗まれる」理不尽、どう回避?--実は守る仕組みが生まれ始めた

    突然ですが、クリエイターにとって最も大切なこととはなんでしょうか。 答えは単純ではないと思いますが、クリエイターの個性を象徴する作風は、彼らが最も大切にしているものの一つと言えるでしょう。絵画や写真、イラストなど、どんな表現手段であれ、プロのクリエイターが持つ独自の作風は、クリエイティブビジネスでの経済的価値を決定しているだけでなく、過去の経験や人間としての視点を反映させた根的な要素であり、彼ら自身を表現しているとも言えます。 【関連記事】 あなたは「生成AI製フェイク画像」を見抜けますか?--判別は"ほぼ無理”な時代、来歴証明が重要なワケ AIが奪う「作風」という資産 しかし、画像生成AIが登場し、インターネット上のテキストや画像、その他のデータを作者に無断で収集して学習したAIによって、クリエイターの作風がいとも簡単に模倣されるようになりました。私の勤めるアドビではBehanceとい

    AIに「作品ではなく作風が盗まれる」理不尽、どう回避?--実は守る仕組みが生まれ始めた
  • 開発ツール・技術まとめ

    開発ツール・技術まとめ 今回は様々な開発ツールや技術を分野別にまとめました。主にソフトウェア開発の現場で使われる多種多様なツールや話題の生成AI関連を紹介します。それぞれのリンクも掲載していますので、気になるものがあればすぐにチェックできます! (適宜更新予定) 生成AI系ツール テキスト生成 ツール名 特徴

    開発ツール・技術まとめ
  • AIロボットペットが子育てロスを癒す、新たなビジネスチャンス | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    子育てが終わった女性が「子育てロス」に陥る割合が高い。その行き場を失った有り余る愛情を受け取り充足感を与えてくれる相手として注目されるのがAIペットロボットだ。 コミュニケーションロボット「Moflin」(モフリン)を展開するカシオ計算機は、18歳以上の子どもを持つ40代以上の女性400人を対象に、子育てロスに関するアンケート調査を行ったところ、これまでに感じたもっとも大きなロス(喪失感)として、7割近くの人が子育てロスをあげた。ペットロスやパートナーロスを大きく上回る。

    AIロボットペットが子育てロスを癒す、新たなビジネスチャンス | Forbes JAPAN 公式サイト(フォーブス ジャパン)
    yamadar
    yamadar 2025/05/01
    「her/世界でひとつの彼女」に時代が追いついた
  • GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億&アクティブパラメーター数220億

    中国のAlibabaが開発する大規模言語モデル(LLM)ファミリーのQwenに、「Qwen3」が登場しました。Qwen3には2つの混合エキスパート(MoE)モデルと、6つのDenseモデルが含まれており、パラメーターサイズは6億から2350億までと非常に幅広いです。 Qwen3: Think Deeper, Act Faster | Qwen https://qwenlm.github.io/blog/qwen3/ GitHub - QwenLM/Qwen3: Qwen3 is the large language model series developed by Qwen team, Alibaba Cloud. https://github.com/QwenLM/Qwen3 Alibaba unveils Qwen3, a family of 'hybrid' AI reasonin

    GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億&アクティブパラメーター数220億
    yamadar
    yamadar 2025/05/01
    クエン酸って読むのかと思ったけど違いそうだな
  • オレオレ RAG をさくっと作る

    この記事は間違いが含まれている可能性があります。 もともと自社のドキュメントでは Meilisearch で日語全文検索を実現していましたが、ドキュメントに質問できるようしたいと思い、簡単な RAG を作りたい!と思っていました。 とりあえず、ドキュメントを分割し、ベクトル化してベクトルデータベースに突っ込んで、質問をベクトル化して結果を引っ張り、それを LLM にべさせて解説させる、というのができればよいということがわかりました。 ベクトル化はよく使われている OpenAI Embeddings API を利用し、ベクトルデータベースは普段からよく使っている DuckDB に VSS (Vector Similarity Search for DuckDB) という拡張を使うことにしました。 自社のドキュメントをなんとかうまいこと分割して、あとは分割したドキュメントを API を叩い

    オレオレ RAG をさくっと作る
    yamadar
    yamadar 2025/04/19
    リレーショナルDBにベクターデータをストアする話
  • AI エージェント新時代到来 A2A protocol を試してみた #GoogleCloudNext | DevelopersIO

    はじめに 2025/4/9-11 の 3日間の日程で Google Cloud Next '25 がラスベガスで開催されています! 4/9 の Keynote にて複数のアップデートがリリースされましたが、リリースの中から A2A protocol について試してみました。 A2A protocol A2A protocol は、AI エージェントの連携を標準化することで、AI を活用したワークフローをさらに実用的にします。 このプロトコルの標準化によって AI エージェントは相互に通信し、様々なエンタープライズプラットフォームやアプリケーション上で活用できるようになります。 すでに 50 社が A2A protocol への対応を表明しています。 ソースコードも公開されているので色々試してみることができます。 Demo アプリ A2A にはデモアプリが付属しており、Web UI 上から動

    AI エージェント新時代到来 A2A protocol を試してみた #GoogleCloudNext | DevelopersIO
  • 次のMCP??A2Aはなんですか

    Model Context Protocol(MCP) MCP 概要 MCP はオープンプロトコルであり、アプリケーションが大規模言語モデル(LLMs)にコンテキストを提供する方法を標準化することを目的としています。AI アプリケーションの「USB-C ポート」に例えられ、AI モデルが異なるデータソースやツールに接続するための標準化された経路を提供します。 MCP の役割 LLM をベースにしたエージェントや複雑なワークフローの構築を支援します。LLM は多くの場合、データやツールの統合が必要ですが、MCP はあらかじめ構築された統合リストを提供し、LLM が直接アクセスできるようにします。異なる LLM プロバイダー間の柔軟な切り替えをサポートし、インフラストラクチャ内でデータセキュリティを確保するためのベストプラクティスを提供します。 MCP アーキテクチャ クライアント - サーバ

    次のMCP??A2Aはなんですか
    yamadar
    yamadar 2025/04/12
    解説助かる
  • MCP入門

    MCP概要説明 この記事はMCP2025-03-26リビジョンを基に作成しました。 Model Context Protocol (MCP) とは何か? MCP は、AI アシスタント(チャットボットや自動化エージェントなど)が、さまざまな外部データやツールにアクセスするための 共通のルール(プロトコル) です。 従来は、AI にデータベースやウェブサービス、ローカルのファイルを使わせたいとき、それぞれ違う接続方法をいちいち作り込む必要がありました。すると、AI を拡張するたびに「新しいツール用の独自コード」を用意しなくてはなりません。 MCP を使うと、「AI ⇔ データやツール」 の接続方式を 標準化 できるため、同じ仕組みでいろいろなデータソースや外部サービスとやり取りできます。これは、AI の開発者とデータ管理者双方にとって、大きな手間削減や再利用性の向上につながります。 Anth

    MCP入門
    yamadar
    yamadar 2025/04/10
    これを読みつつ、実際にMCPサーバーとMCPクライアントを作ると理解が深まりそう。
  • MCPに入門する/ Introduction to MCP

    最近話題のModel Context Protocol(MCP)に関して、社内の勉強会(部内)で利用した資料を公開します! ざっくり以下の内容が入っています! プロトコル仕様 AWS MCPの話 開発方法

    MCPに入門する/ Introduction to MCP
  • やさしいMCP入門

    4/9(水) お昼にYouTubeでも解説します🙌 やさしいMCP入門 & 実践LT会(KAGと学ぼう!勉強会) https://kddi-agile.connpass.com/event/351600/

    やさしいMCP入門
  • イーロン・マスク率いるDOGEが6000万行ものCOBOLコードを含む社会保障局のシステムをコード生成AIでわずか数カ月の内に移行させようとしており危険性が指摘されている

    by Gage Skidmore 海外ニュースメディア・WIREDが、イーロン・マスク氏の率いる政府効率化部門(DOGE)がアメリカ社会保障局(SSA)のコンピューターシステムを、数ヶ月という短期間でCOBOLからJavaなどへ移行しようとしていると報じています。ソーシャルニュースサイトのHacker Newsで、この移行計画を危険視する声が挙がっています。 Doge Plans to Rebuild SSA Codebase in Months | Hacker News https://news.ycombinator.com/item?id=43505659 SSAは2017年にコアシステムを置き換えるための数億ドル規模の計画を発表しており、その際には約5年かけて近代化を進める予定でした。しかし2020年に発生したCOVID-19パンデミックにより、この取り組みは一時休止しています。

    イーロン・マスク率いるDOGEが6000万行ものCOBOLコードを含む社会保障局のシステムをコード生成AIでわずか数カ月の内に移行させようとしており危険性が指摘されている
    yamadar
    yamadar 2025/04/01
    大きめの技術実証実験だ。結果を楽しみにしてる
  • ミャンマー大地震 SNSに生成AIで作成の偽動画も拡散か 注意を | NHK

    ミャンマー中部で発生した大地震について、SNSでは生成AIで作られたとみられる偽の動画が広がっています。災害が起きたときには偽の動画や根拠不明の情報などが広がりやすく、安易に拡散させないよう注意が必要です。 今月28日に発生した、ミャンマー中部を震源とするマグニチュード7.7の大地震のあと、SNSでは現地の様子を撮影した動画や支援の呼びかけが多く投稿されている一方、生成AIで作られたとみられる偽の動画も複数確認されています。 このうち、仏教寺院の塔がある街で多くの建物が倒壊した様子を上空から撮影したような動画は、日語でのXの投稿が10万回以上閲覧されていますが、NHKが元の動画を調べたところ、生成AIを使って動画を作成するサービスの「透かし」があることが確認できました。 この偽動画はさまざまな言語で拡散し、被災地の様子だとして、インドネシアやロシアなどのメディアが引用していました。 また

    ミャンマー大地震 SNSに生成AIで作成の偽動画も拡散か 注意を | NHK
    yamadar
    yamadar 2025/04/01
    善悪に関わらずとにかく注目されれば金が入る仕組みが悪い
  • MCPで広がるLLM 〜Clineでの動作原理〜

    この記事『Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜』では、Clineの内部構造について解説しました。今回は、その中でも最近、特に注目されている機能の一つ、MCPについての概要、ならびにCline内部での実装方法について詳しく掘り下げていきます。 そもそもMCPとは MCP(Model Context Protocol)はClineやCursorなどといった、LLMを使用しているクライアントがMCPサーバーと連携するためのプロトコルです。広義的に、MCPとはそのプロトコルを使用したサービスのことを指します。 MCPサーバーとはクラウド上のサービスやローカルで立ち上げているサーバーなどのことです。LLMがこのサーバーと連携することで、Notionのファイル編集やSupabaseのデータベースクエリ、Cloudflareのステータスチェック、ローカルのファイル編集などが可能に

    MCPで広がるLLM 〜Clineでの動作原理〜
    yamadar
    yamadar 2025/03/31
    Model Context Protocol, LLM使用クライアントがMCPサーバー(Github、Notion、ローカルシステム等)と連携し、「行動する」能力を与えるためのプロトコル。MCPはそのプロトコルを使用したサービスのこと
  • 生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ) | テクノエッジ TechnoEdge

    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。 現在、アメリカ人の約4分の1がAI検索ツールを従来の検索エンジンの代わりに使用しているとされています。 研究チームは、ニュースコンテンツを正確に検索し引用する能力を評価するため、リアルタイム検索機能を持つ8つの生成型検索ツール(ChatGPTPerplexity、Per

    生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ) | テクノエッジ TechnoEdge
  • 動画生成AI、革命の兆し 「Stable Diffusion」級の衝撃再び (1/5)

    アリババグループの通義研究所が2月にオープンモデルとして公開した動画生成モデル「Wan 2.1」の性能がめちゃめちゃ高いことがわかってきました。一貫性が高く、また、柔軟性も高く、LoRAといった追加学習データとも組み合わせても、素直にデータを反映するとの評価が高まっています。ユーザーが技術開発に関わることで、多数の新しい表現の可能性を模索する動きが登場しつつあります。ローカル環境で動かす動画AIでは、商用クラウド並の水準の動画が作れないという常識がひっくり返され、動画生成AIにStable Diffusion登場時に近いようなインパクトをもたらしつつあります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 圧倒的に性能が高い「Wan 2.1」の衝撃 ▲ファンタジー風の戦車を動かしている動画 Wan 2.1の性能の高さを

    動画生成AI、革命の兆し 「Stable Diffusion」級の衝撃再び (1/5)
  • プロンプトアイデア #7 ~まだ見ぬ領域へ。5つの革新的プロンプトテクニック~|hirokaji

    1. はじめにシリーズ「プロンプトアイデア」第7弾へようこそ。これまで6回にわたり、さまざまなプロンプトエンジニアリングの手法を紹介してきました。回を追うごとに多様なテクニックが生まれてきていますが、今回のテーマも「まだ世にほとんど出回っていない、新しいプロンプトテクニック」に焦点を当てます。 多視点の同時展開や自己レビューを強化する流れは、すでに注目されている領域です。しかし、それらをさらに発展させ、かつ直感的で実用的に使える形へとブラッシュアップした――そんな5つの革新的アイデアを厳選してご紹介します。 この第7弾の記事を通じて、新手法を実践する意義や、その背後にある発想を理解していただきたいと思います。 2. 既存プロンプト技法の振り返り多視点プロンプトや逆算思考の手法は、すでにSNSや論文などで広がりを見せています。 しかし、並列思考を促す手法は「早期のアイデア収束」や「視点間の干

    プロンプトアイデア #7 ~まだ見ぬ領域へ。5つの革新的プロンプトテクニック~|hirokaji
    yamadar
    yamadar 2025/03/01
    これは良い感じだ。LLM利用における「設計」という感じがする
  • CLINEに全部賭けろ

    Cline を使い始めて2ヶ月ぐらい経った。 自分の直感として、Cline は真のイノベーションの入口であり、そして開けてはいけないパンドラの箱でもあったと思う。 ここでいう Cline は Cline型コーディングエージェントであり、広義には Devin / Cursor や Copilot Agent 等を含む話。だが、後述するように Cline でしか見えない世界がある。 その先の未来に、プログラマとしての自分はフルベットする、という話をする。 私たちが知っているプログラミングの終焉 大事なことは次の記事に全部書いてある。まずこれを読んでほしい。 (Google翻訳) Steve Yegge 氏は、置き換えられるのはジュニアおよび中級レベルのプログラマーではなく、新しいプログラミング ツールやパラダイムを受け入れず過去に固執するプログラマーであると指摘しています。 <略> これはプロ

    CLINEに全部賭けろ
    yamadar
    yamadar 2025/02/27
    『コンテキストを記述する能力、ドメインを記述する能力、AIの性能に対する直感』『『適切なモジュール分割、境界づけられたコンテキストの抽出であり、ユビキタス言語の構築、DDD、実装対象の抽象化能力』