[go: up one dir, main page]

タグ

sh19910711のブックマーク (30,751)

  • モバイル向け大量描画テクニック | ドクセル

    sh19910711
    sh19910711 2025/10/25
    2022 / "DrawIndirect: GPU駆動レンダリング + データをCPU経由せず + GPUだけで描画の制御ができる / GraphicsBuffer: ComputeBufferを将来的に置き換え"
  • GPT4相当のLLMをローカルで自由に学習させたい

    1. 概要 記事では、Meta の LLM である Llama3 70B モデル を RTX3090(24GB)を搭載した計算機二台で分散学習する手法について紹介します。 kubernetes で作成した オンプレミスの GPU クラスタ(RTX3090×2)にて、FSDP_QLoRa という手法を活用した分散学習を行うことで、24GB GPU を搭載した PC 二台という比較的実現しやすい環境での学習を実現します。 2. 前提 対象者 LLM をトレーニングしたいが、API(OpenAI など)経由だと簡単なファインチューニングしかできない、クラウドサービス上での学習はコスト的に厳しい、けど 24GB GPU を搭載した PC 二台くらいは用意できるという方。(研究室の学生はこういう方多いんじゃないでしょうか?知らんけど) FSDP_QLoRa について FSDP_QLoRa とは、Q

    GPT4相当のLLMをローカルで自由に学習させたい
    sh19910711
    sh19910711 2025/10/25
    2024 / "FSDP_QLoRa では、QLoRA で極限までメモリ使用量を減らした後に、モデルを分割するというプロセスによって、低コストの計算資源で LLM を学習 / ネットワークがボトルネックになってかなり学習速度が落ちた"
  • AIと開発するときにも初期から始めた方が良いこと - Flavor Wheel Engineering

    開発時に標準的に使われるコマンドを整備する Next.jsプロジェクトであれば pnpm run typecheck pnpm run build などがあることは当然だろうから、それらはpackage.jsonに書いて実行可能な状態にしておくと良い。AIは既存のコードを学習しているので、これらのコマンドを変換結果の確認に使おうとする。その時に独自のコマンド名にしていたり、コマンドを準備していないと実行に失敗して無駄な試行錯誤の時間を取られてしまう。 また、AIがコードを編集したとしてもレビューをするのは人間なので差分を見やすい状態に維持しておきたい。AIは大量にコードを書くし、Vibe Codingだと差分が大きくなりがち。ただでさえ差分が多いと量的にレビューが大変なのに加えてフォーマットのような質的でない差分が含まれているとよりレビューが辛くなる。全部必要だが個人的な優先順は、ビ

    AIと開発するときにも初期から始めた方が良いこと - Flavor Wheel Engineering
    sh19910711
    sh19910711 2025/10/25
    "筋がよくない実装を油断していると混ぜてくるので、人間側もレビューで防いだり早期に軌道修正できるように学習が必要 / 公式ドキュメントなど信頼できる情報源を自分で読みにいく方が確実"
  • 現実とゲームの関係性が揺らぐとき何が起きるか……<br>求められるゲーム・リテラシー教育 - メディア芸術カレントコンテンツ

    メディア芸術領域の現状をより深く、広く伝えるため愛称を「MACC」とし、総合的な広報用ウェブサイト「メディア芸術カレントコンテンツ(MACC)」として令和5年2月13日リニューアルオープンしました。 (https://macc.bunka.go.jp/) 当サイトは、これまでの記事をアーカイブとして掲載しています。 ゲームは現実世界の抽象化と誇張化の産物だ。その一方で近年、両者の関係性をゆるがすような出来事が、良い意味でも悪い意味でも起きている。ゲームと現実の関係性を整理するうえで、改めてゲーム・リテラシー教育の重要性が問われている。 『Plague Inc: Evolved』(PC版) ゲームにジャーナリズムの視点を持ちこむNewsgame 拙稿「ヴィデオ・ゲームは現実世界に何を与え得るのか……「イン・ア・ゲームスケープ ヴィデオ・ゲームの風景、リアリティ、物語、自我」展覧会レポート」で

    現実とゲームの関係性が揺らぐとき何が起きるか……<br>求められるゲーム・リテラシー教育 - メディア芸術カレントコンテンツ
    sh19910711
    sh19910711 2025/10/25
    2020 / "ゲームは現実の抽象化と誇張化の産物 / どのようなゲームであっても、そこから何らかの学びを得ることは可能だし、批判することも可能 / ゲームの特性について学び、正しくゲームと付き合う"
  • リーズナブルに整えるオンラインミーティング向けマイク環境 | おそらくはそれさえも平凡な日々

    ポッドキャスト「趣味でOSSをやっている者だ」 を1年くらい続けてきたので、今のマイク環境について書いてみようと思う。あまり大げさな機材を使わず、リーズナブルでコンパクトな構成を志向している。なので、普通の人のリモート会議用にも使える構成だと思うので、参考にしてもらえると嬉しい。 現在のマイク周りは以下のようになっている。これはデスクの左側の壁の様子で、この右側にPCモニターがある。 マイク - JBL QUQNTUM STREAM マイクは JBL QUANTUM STREAM。USB接続できるコンデンサマイクで、体は缶コーヒーを一回り大きくしたくらいにコンパクト。ゲーム配信者なども使っているモデルで信頼度も高く、実際音質も悪くない。あとは、サイドトーン機能という、マイクにモニターヘッドフォンを挿して自分の音声を聞きながら収録できる機能も備えている。これが1万円程度で買えるのは破格。

    リーズナブルに整えるオンラインミーティング向けマイク環境 | おそらくはそれさえも平凡な日々
    sh19910711
    sh19910711 2025/10/25
    "JBL QUANTUM STREAM: USB接続できるコンデンサマイク + 本体は缶コーヒーを一回り大きくしたくらいにコンパクト / 声の収録であればダイナミックマイクを使った方がクリア"
  • 【データ整理】Unicode正規化とMySQL COLLATION

    utf8mb4_bin はバイナリレベルで文字を比較するため当然全て異なる結果となります。 utf8mb4_general_ci は比較的よく使われるCollationですが、半角アルファベットの大文字小文字の違いが同一視されるのが特徴です。 また絵文字の区別はされないのはよく「寿司ビール問題」として有名ですね。 utf8mb4_unicode_ci は「ア」「ア」が同一されるのは良いですが、「は」「ぱ」「ば」あたりが同一視されるなど、日語を扱う上では正直使いにくいという印象です。 utf8mb4_unicode_520_ci は、utf8mb4_unicode_ci に対して絵文字が全て同一視されるのを無くしたCollationですが、utf8mb4_unicode_ciと同じく日語には不向きです。 テーブルのデフォルト Collation MySQLではテーブルを作るときにCHAR

    【データ整理】Unicode正規化とMySQL COLLATION
    sh19910711
    sh19910711 2025/10/25
    2023 / "NFD・NFCの場合は「A」「A」のように全角半角による差を吸収しない / NFDとNFCの違いは、合成文字を変換した場合に表れ / 半濁音の文字は、「結合済文字」で表す方法と「基底文字 + 結合文字」で表す方法の2通り"
  • MySQLのVECTORデータ型とベクトル検索 - 虎の穴ラボ技術ブログ

    こんにちは、虎の穴ラボ FantiaエンジニアのT.Kです。 今回はMySQL 9.0で追加されたVECTORデータ型カラムと、それをもとにベクトル検索を試した結果を共有します。 ベクトル検索とは ベクトル検索とは、テキストなどのデータを数値ベクトルとして表現し、それらの類似度をもとに対象を検索できる機能のことです。 PostgreSQLでは拡張機能を用いることで以前から利用可能になっており、それにやや遅れてMySQLでも利用できるようになりました。 ただし今回試したのはCommunity版なので、ベクトル距離を測るDISTANCE関数は使用できません。そのため、距離計算はアプリ側で実施します。 現時点では、DISTANCE関数はOCIのHeatWave MySQLのみ利用できます。 dev.mysql.com 早速試す 基的に「データ(今回はテキスト)をベクトル化する」「それをINSE

    MySQLのVECTORデータ型とベクトル検索 - 虎の穴ラボ技術ブログ
    sh19910711
    sh19910711 2025/10/25
    "MySQL 9.0で追加されたVECTORデータ型カラム / 現時点では、DISTANCE関数はOCIのHeatWave MySQLのみ / STRING_TO_VECTORという関数"
  • 到達圏検索をローカル環境で実現する3つの方法 — OSMデータの活用 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 近年、Google Maps PlatformMapbox、HERE などの地図SaaSを利用すれば、API経由で手軽に「到達圏(isochrone)」を取得できるようになりました。 しかし、商用SaaSには以下のような課題もあります。 API利用料が高い:大量リクエストやバッチ処理には不向き 制限が厳しい:利用回数、リクエスト数、地理的範囲などに制約 データの自由度が低い:独自データとの統合やカスタム分析が難しい これらの課題を踏まえ、記事では、 OpenStreetMap(OSM) のオープンデータを活用し、ローカ

    到達圏検索をローカル環境で実現する3つの方法 — OSMデータの活用 - Qiita
    sh19910711
    sh19910711 2025/10/25
    "「どこまで行けるか」「どの地域がアクセスしやすいか」を定量的に把握する / 距離(iso–distance)や時間(iso–time)といった基準で定義される / GraphHopper: Javaで実装されたルーティングエンジン + 高速な経路探索"
  • 毎週1本ゲームを作って分かったこと - はじめのゲーム開発ブログ

    今日はここ数回に渡って書いた、毎週1ゲームを作って感じたことシリーズで書ききれなかったものを書きますね。 アプリをリリースする時の注意点 アプリとしてリリースする場合、色々問題があります。1つはコスト。Androidは分からないので割愛しますがiOSは申請までに画像や登録の手間がかかるので慣れても数時間は取られます。 1度目はアプリを出す感動がモチベーションになるのでやってもいいと思いますが、毎週リリースするのはよく考えた方がいいでしょう。 私は3でやめて、最近はunityroomにアップしています。こちらは15分もあれば終わります。 もう1つは、あまりに質の低いゲームを出すのはブランドの信用を失う可能性があります。期限を優先して作ると面白くない、バグがあるゲームは当たり前になってきます。 練習としてはいいですが、ユーザーにはそんな事情は分からないので単にクソゲーしかないブランドとしか

    毎週1本ゲームを作って分かったこと - はじめのゲーム開発ブログ
    sh19910711
    sh19910711 2025/10/25
    2018 / "期限を決めて作る場合、いつ期限が来ても終わらせることができるように一旦最初から最後まで通して遊べるようにしておきます / あとは時間まで作り込みをすればクオリティは別として必ず完成"
  • Vespaを利用したテクいベクトル検索

    sh19910711
    sh19910711 2025/10/25
    2024 / "Binarizationによって格納容量を節約できるが、距離計算にコサイン類似度/内積/ユークリッド距離は不適 / ベクトル検索の利用を実際に検討すると、見えてなかった課題が浮かび上がってくる"
  • 【Unity URP】キャラクタートゥーンシェーダの表現手法をまとめる その3(アウトライン[背面法])

    はじめに いつかキャラクタートゥーンシェーダの記事を書きたいと考えていたので,基礎的なところから書いていこうと思います.この記事では,キャラクタートゥーン表現をおこなう上での表現を,手法別に記載していきます. 環境は,UnityのURPを前提としてシェーダを書いていきます.また,シェーダのお作法など基礎的な話は省略して説明していくのでご了承ください. Unityの環境は以下の通りです. Unity 2021.3.8f1 キャラクターモデルはsonoさんのQuQuオリジナルアバター”U”ちゃんを用いています(かわいいのでみんな買おう!). QuQu - BOOTH この記事はこれの続きになります 【Unity URP】キャラクタートゥーンシェーダの表現手法をまとめる その2(明暗境界線の彩度上げ) 手法3:アウトライン(背面法) 表現したい内容 アウトラインを表現してみます.アウトラインとは

    【Unity URP】キャラクタートゥーンシェーダの表現手法をまとめる その3(アウトライン[背面法])
    sh19910711
    sh19910711 2025/10/25
    2023 / "背面法: アウトライン用のモデル描画と,通常用のモデル描画で2回 / 少し通常モデルサイズよりも大きいモデル裏面 + 頂点シェーダでクリッピング空間の法線ベクトル方向に頂点座標を移動させる"
  • eKYCの現状と今後のトレンド - inSmartBank

    こんにちは、6月に業務委託からスマートバンクに正式入社した、サーバーサイドエンジニアの toshimaru です。 スマートバンクの開発チームに参画して間もない頃、聞き慣れず戸惑った言葉の1つとして eKYC(オンライン人確認)方式の名称があります(ホ方式、ワ方式など)。 記事では、私がわからなかったこの eKYC の方式および今後のeKYCのトレンドについて解説したいと思います。 なぜeKYCする? eKYCの方式まとめ ホ方式 新ホ方式(2027年4月〜) ワ方式 ワ方式からカ方式、そしてヲ方式に? ル方式 JPKI方式と比較してのメリット 今後のeKYCのトレンド 📣【宣伝】ワンバンクのeKYCについての発表があります 📚参考資料 なぜeKYCする? まず、なぜ人確認をしなければならないのでしょうか? 当社は資金決済法に基づく資金移動業の登録を受けており、犯罪収益移転防止法

    eKYCの現状と今後のトレンド - inSmartBank
    sh19910711
    sh19910711 2025/10/25
    "資金決済法に基づく資金移動業 + 取引時確認(本人確認等)が義務付け / ル方式はカード代替電磁的記録を用いた方法 + 執筆時点でここで出てくる「送信用プログラム」として認定を受けているのはAppleウォレットのみ"
  • 1000冊以上読破した僕が〝文章の教科書〟として薦めるとっておきの9冊 - 思考の整頓

    前回こちらで、大好きなブロガーさんや良記事を紹介しながら、自戒をこめて名文とはこういうものだ!という記事を書きましたが、今回は僕が文章の教科書としているを紹介します。 ■文章の師匠が見つかれば、半分成功したようなもの 1.毎月新聞 (佐藤雅彦) 毎月新聞 (中公文庫) 作者: 佐藤雅彦 出版社/メーカー: 中央公論新社 発売日: 2009/09 メディア: 文庫 購入: 5人 クリック: 76回 この商品を含むブログ (46件) を見る まず紹介する一冊目は、佐藤雅彦さんのコラム集『毎月新聞』 趣味で文章を書き始めたばかりの大学1年の春、BOOKOFFでたまたまこの一冊を見つけた。 「僕が書きたかったものこれだったのか…!」と衝撃を受け、文章の書き方のイロハをまったくわかっていなかった僕は「こうやって文章を書けば、面白くなるのか!」と大興奮だった。 ちょうどその日、家でむさぼるように読ん

    1000冊以上読破した僕が〝文章の教科書〟として薦めるとっておきの9冊 - 思考の整頓
    sh19910711
    sh19910711 2025/10/25
    2017 / "文章の面白さ=「体験」×「思考力」×「文章力」 / どんな本を読むと良いかと言うと、「みんなが読まない本」 / みんなが読まないというだけで、その本に書かれている情報に希少価値が上がり、優位性が生まれる"
  • R言語の過去と最新の動向

    連載「フリーソフトによるデータ解析・マイニング」は今月号をもって終了となります。 2003年8月に連載第1回として金明哲氏による「データ解析・マイニングとR言語」という記事が掲載されて以来、 約12年半149回に渡り、6名の執筆陣がR言語とデータ解析について解説してきました。 最終回となる今回は、過去10年余りのR言語の国内での普及、 そしてR言語の最新の動向について紹介しながら、有用な情報をピックアップしてみます。 なお今回の記事には著者の主観が多分に反映されていることをご承知おき下さい。 R言語の10余年史 コンピュータのバックアップ履歴を漁ってみたところ、著者自身は大学院生だった2003年頃からRを触り始めて、 2004年夏頃に研究のための分析ツールとしてRを導入していたようです。 この頃のRのバージョンは1.7から1.8だったように記憶しています。 連載の開始時期と著者のR利用

    sh19910711
    sh19910711 2025/10/25
    2015 / "RjpWikiがオープンした2003年は、日本国内のR言語の普及にとって一つの大きな転換点であった / 2003〜2004年にはR言語の利用を中心に解説した書籍が刊行"
  • TOEIC受験時の確実にスコアアップにつながるテクニック+α - こんにゃくマガジン

    スポンサーリンク はじめに 実力をつけてハイスコアをとるのが理想ですが、とにかくスコアが必要なんだという人のための参考情報です。 私もどうしても900点以上欲しくて30過ぎのおっさんなりに勉強も頑張ったのですが、最後にこれらの小技に助けられた気がします。 TOEICはとにかく時間との戦いで、全精神エネルギーを出し切る必要があります。試験時間の1秒も無駄にしないように個人的に工夫した小技+αをまとめました。 小技の練習のためにも模擬試験はやっておいた方がいいと思います。 私は前日と前々日に下記の模擬試験をやったんですが、予想スコアの精度がすごいと思いました(実際にとったスコアとの差は10点以内でした)。 TOEICテスト超リアル模試600問[MP3音声付] 作者: 花田徹也出版社/メーカー: コスモピア発売日: 2011/02/25メディア: 単行(ソフトカバー)購入: 4人 クリック:

    TOEIC受験時の確実にスコアアップにつながるテクニック+α - こんにゃくマガジン
    sh19910711
    sh19910711 2025/10/25
    2015 / "リスニングの問題が流れている間は、数秒聞き逃しただけで正解が分からなくなってしまうので、聞くことに全神経を集中しておく / 各問題ごとに印をつけておくだけにして、パートが終わってからまとめて塗る"
  • 情シスが社内ネットワークの可視化に取り組んだら意外なものが見えてきた話|Clorets8lack

    小型のパケットキャプチャ装置を売っています、黒ブラといいます。 普段お客様に対して、社内ネットワークの可視化をすると色々分かることがありますよ、というお話をするのですが、具体的に何がどう分かって、どう改善するのかというようなことが短い商談では伝えきれないことがよくあるので、僕の原体験となったある出来事について書き残しておこうと思います。 僕は新卒で商社に入り、情報システム部門に配属されました。 最初に覚えた仕事PCのキッティングをはじめとするヘルプデスクでしたが、当時新システムの導入が大炎上しており、入社2年目からそのシステム開発のお手伝いに駆り出されました。 ヘルプデスクSQL開発の2足のわらじで僕の情シスキャリアはスタートします。 システムのリリースが一段落した後、僕はあるサブシステムの運用を任されます。 どういう運用業務かというと、そのシステムがたまに止まるので、データベースの止

    情シスが社内ネットワークの可視化に取り組んだら意外なものが見えてきた話|Clorets8lack
    sh19910711
    sh19910711 2025/10/25
    2020 / "取れなかった情報を何とか取れるようにする / いつ起こるかわからない問題には定常的な観測が必要 / データを取り、それを読み解き、適切なフォローをする事で、きちんと改善効果が表れる"
  • OpenGLとC++で大規模(数億オーダー) 点群をリアルタイムで表示する - AKARI Tech Blog

    はじめに 今週のAKARI Tech Blogは、DX Solution 事業部 Dev nebulaの西宮が担当します! 今回は、開発している三次元シミュレーションソフトに点群表示を実装する際に行った工夫について紹介します。 開発中のシミュレータの点群表示機能。点群はオープンナガサキを使用建築、都市計画、自動運転など、多くの分野で大規模な点群データを扱う機会が増えています。 しかし、数千万から数十億に及ぶ大規模点群のなかをGoogle Street Viewのように自由に移動しながら表示するには、パフォーマンスの面でいろいろな工夫が必要です。 記事では、一番簡単でオーソドックスな実装だけではなく、より大規模なシーンをレンダリングするための主要なアプローチをOpenGLでの描画を前提として解説します。 (同じシミュレーションソフトで学習画像を自動生成しSim2Realした例もあります。

    OpenGLとC++で大規模(数億オーダー) 点群をリアルタイムで表示する - AKARI Tech Blog
    sh19910711
    sh19910711 2025/10/25
    "点群ソートを利用してバッチとして点群を分割し、メモリ上の局所性と物理的な点の位置の局所性を一致させている / 空間的な局所性が高いほど、カリングや座標圧縮の効果が高まり効率化"
  • バイナリを読み解いて学ぶDNSパケットの構造

    最近RustDNSリゾルバを自作する記事を読んだので、勉強がてらGo言語で書き換えることにしました。 記事ではまずDNSのプロトコルについてバイナリレベルで解説します。次回の記事でGo言語を使用して実際にDNSパケットのパーサーを作成します。 DNSとは DNSはドメイン名をIPアドレスに名前解決するために使用される通信プロトコルです。 通常、DNSパケットはUDPトランスポートを使用して送信され、512バイトに制限されています。 ただし、TCPで送信することも可能で、eDNSを仕様することでパケットサイズを拡張することもできます。 記事では従来のUDPによるDNSパケットの送信について解説します。 UDPにおけるDNSパケットの最大長が512バイトである理由 IPv4の仕様では最小パケットサイズとして576バイトと定義されています。 この値は、64バイトのヘッダーと512バイトのデ

    バイナリを読み解いて学ぶDNSパケットの構造
    sh19910711
    sh19910711 2025/10/25
    2023 / "DNSはパケットサイズが512バイト / ドメイン名の長さ、レコードの数次第ではドメイン名を圧縮しないと容易にその制限を超える / ただし、TCPで送信することも可能で、eDNSを仕様することでパケットサイズを拡張"
  • ライブカメラに映った落雷をAmazon Novaで検出する試み

    こんにちは。ウェザーニューズ モバイル・インターネット事業部の hoka です。 ウェザーニューズにはウェザーニュース アプリユーザーのみなさまにご協力いただき設置しているライブカメラが日国内に 2000 ヵ所以上あります。ライブカメラの映像を動画理解モデルである Amazon Nova を使って解析し、落雷の検出を試してみました。 録画・検出例 落雷・稲がはっきり映っていることがわかります。 落雷の検出例(茨城県 土浦市) 落雷の検出例(石川県 珠洲市) 落雷検出のアプローチ 3 つのステップに分けて処理しています 落雷が発生した地点周辺のライブカメラを録画 映像内で輝度がスパイクした箇所の前後を切り出し Amazon Nova で落雷の有無を解析 Step 1: 落雷が発生した地点周辺のライブカメラを録画 落雷が発生した地点周辺のライブカメラをピックアップして録画しました。落雷の情

    ライブカメラに映った落雷をAmazon Novaで検出する試み
    sh19910711
    sh19910711 2025/10/25
    "ffprobe を使ってフレームごとの輝度を取得し、フレーム間の輝度差分が 99.5 パーセンタイルを超えており、MAD(Median Absolute Deviation)が一定値を超えている箇所をスパイクとして検出"
  • mypyの10年、pyrightの5年 tyの挑戦 - 型チェッカー進化論 -

    型チェッカーの歴史と性能比較について少しだけ掘り下げます

    mypyの10年、pyrightの5年 tyの挑戦 - 型チェッカー進化論 -
    sh19910711
    sh19910711 2025/10/25
    "型ヒント標準化: 2015年はPythonの型元年 + PEP 484(Type Hints)が採択 + Python 3.5にtypingモジュールが追加 / pyright: mypyが発見できないエラーを検出することもある"