1. 概要 本記事では、Meta の LLM である Llama3 70B モデル を RTX3090(24GB)を搭載した計算機二台で分散学習する手法について紹介します。 kubernetes で作成した オンプレミスの GPU クラスタ(RTX3090×2)にて、FSDP_QLoRa という手法を活用した分散学習を行うことで、24GB GPU を搭載した PC 二台という比較的実現しやすい環境での学習を実現します。 2. 前提 対象者 LLM をトレーニングしたいが、API(OpenAI など)経由だと簡単なファインチューニングしかできない、クラウドサービス上での学習はコスト的に厳しい、けど 24GB GPU を搭載した PC 二台くらいは用意できるという方。(研究室の学生はこういう方多いんじゃないでしょうか?知らんけど) FSDP_QLoRa について FSDP_QLoRa とは、Q
開発時に標準的に使われるコマンドを整備する Next.js のプロジェクトであれば pnpm run typecheck pnpm run build などがあることは当然だろうから、それらはpackage.jsonに書いて実行可能な状態にしておくと良い。AIは既存のコードを学習しているので、これらのコマンドを変換結果の確認に使おうとする。その時に独自のコマンド名にしていたり、コマンドを準備していないと実行に失敗して無駄な試行錯誤の時間を取られてしまう。 また、AIがコードを編集したとしてもレビューをするのは人間なので差分を見やすい状態に維持しておきたい。AIは大量にコードを書くし、Vibe Codingだと差分が大きくなりがち。ただでさえ差分が多いと量的にレビューが大変なのに加えてフォーマットのような本質的でない差分が含まれているとよりレビューが辛くなる。全部必要だが個人的な優先順は、ビ
メディア芸術領域の現状をより深く、広く伝えるため愛称を「MACC」とし、総合的な広報用ウェブサイト「メディア芸術カレントコンテンツ(MACC)」として令和5年2月13日リニューアルオープンしました。 (https://macc.bunka.go.jp/) 当サイトは、これまでの記事をアーカイブとして掲載しています。 ゲームは現実世界の抽象化と誇張化の産物だ。その一方で近年、両者の関係性をゆるがすような出来事が、良い意味でも悪い意味でも起きている。ゲームと現実の関係性を整理するうえで、改めてゲーム・リテラシー教育の重要性が問われている。 『Plague Inc: Evolved』(PC版) ゲームにジャーナリズムの視点を持ちこむNewsgame 拙稿「ヴィデオ・ゲームは現実世界に何を与え得るのか……「イン・ア・ゲームスケープ ヴィデオ・ゲームの風景、リアリティ、物語、自我」展覧会レポート」で
ポッドキャスト「趣味でOSSをやっている者だ」 を1年くらい続けてきたので、今のマイク環境について書いてみようと思う。あまり大げさな機材を使わず、リーズナブルでコンパクトな構成を志向している。なので、普通の人のリモート会議用にも使える構成だと思うので、参考にしてもらえると嬉しい。 現在のマイク周りは以下のようになっている。これはデスクの左側の壁の様子で、この右側にPCやモニターがある。 マイク - JBL QUQNTUM STREAM マイクは JBL QUANTUM STREAM。USB接続できるコンデンサマイクで、本体は缶コーヒーを一回り大きくしたくらいにコンパクト。ゲーム配信者なども使っているモデルで信頼度も高く、実際音質も悪くない。あとは、サイドトーン機能という、マイクにモニターヘッドフォンを挿して自分の音声を聞きながら収録できる機能も備えている。これが1万円程度で買えるのは破格。
utf8mb4_bin はバイナリレベルで文字を比較するため当然全て異なる結果となります。 utf8mb4_general_ci は比較的よく使われるCollationですが、半角アルファベットの大文字小文字の違いが同一視されるのが特徴です。 また絵文字の区別はされないのはよく「寿司ビール問題」として有名ですね。 utf8mb4_unicode_ci は「ア」「ア」が同一されるのは良いですが、「は」「ぱ」「ば」あたりが同一視されるなど、日本語を扱う上では正直使いにくいという印象です。 utf8mb4_unicode_520_ci は、utf8mb4_unicode_ci に対して絵文字が全て同一視されるのを無くしたCollationですが、utf8mb4_unicode_ciと同じく日本語には不向きです。 テーブルのデフォルト Collation MySQLではテーブルを作るときにCHAR
こんにちは、虎の穴ラボ FantiaエンジニアのT.Kです。 今回はMySQL 9.0で追加されたVECTORデータ型カラムと、それをもとにベクトル検索を試した結果を共有します。 ベクトル検索とは ベクトル検索とは、テキストなどのデータを数値ベクトルとして表現し、それらの類似度をもとに対象を検索できる機能のことです。 PostgreSQLでは拡張機能を用いることで以前から利用可能になっており、それにやや遅れてMySQLでも利用できるようになりました。 ただし今回試したのはCommunity版なので、ベクトル距離を測るDISTANCE関数は使用できません。そのため、距離計算はアプリ側で実施します。 現時点では、DISTANCE関数はOCIのHeatWave MySQLのみ利用できます。 dev.mysql.com 早速試す 基本的に「データ(今回はテキスト)をベクトル化する」「それをINSE
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 近年、Google Maps Platform や Mapbox、HERE などの地図SaaSを利用すれば、API経由で手軽に「到達圏(isochrone)」を取得できるようになりました。 しかし、商用SaaSには以下のような課題もあります。 API利用料が高い:大量リクエストやバッチ処理には不向き 制限が厳しい:利用回数、リクエスト数、地理的範囲などに制約 データの自由度が低い:独自データとの統合やカスタム分析が難しい これらの課題を踏まえ、本記事では、 OpenStreetMap(OSM) のオープンデータを活用し、ローカ
今日はここ数回に渡って書いた、毎週1本ゲームを作って感じたことシリーズで書ききれなかったものを書きますね。 アプリをリリースする時の注意点 アプリとしてリリースする場合、色々問題があります。1つはコスト。Androidは分からないので割愛しますがiOSは申請までに画像や登録の手間がかかるので慣れても数時間は取られます。 1度目はアプリを出す感動がモチベーションになるのでやってもいいと思いますが、毎週リリースするのはよく考えた方がいいでしょう。 私は3本でやめて、最近はunityroomにアップしています。こちらは15分もあれば終わります。 もう1つは、あまりに質の低いゲームを出すのはブランドの信用を失う可能性があります。期限を優先して作ると面白くない、バグがあるゲームは当たり前になってきます。 練習としてはいいですが、ユーザーにはそんな事情は分からないので単にクソゲーしかないブランドとしか
はじめに いつかキャラクタートゥーンシェーダの記事を書きたいと考えていたので,基礎的なところから書いていこうと思います.この記事では,キャラクタートゥーン表現をおこなう上での表現を,手法別に記載していきます. 環境は,UnityのURPを前提としてシェーダを書いていきます.また,シェーダのお作法など基礎的な話は省略して説明していくのでご了承ください. Unityの環境は以下の通りです. Unity 2021.3.8f1 キャラクターモデルはsonoさんのQuQuオリジナルアバター”U”ちゃんを用いています(かわいいのでみんな買おう!). QuQu - BOOTH この記事はこれの続きになります 【Unity URP】キャラクタートゥーンシェーダの表現手法をまとめる その2(明暗境界線の彩度上げ) 手法3:アウトライン(背面法) 表現したい内容 アウトラインを表現してみます.アウトラインとは
こんにちは、6月に業務委託からスマートバンクに正式入社した、サーバーサイドエンジニアの toshimaru です。 スマートバンクの開発チームに参画して間もない頃、聞き慣れず戸惑った言葉の1つとして eKYC(オンライン本人確認)方式の名称があります(ホ方式、ワ方式など)。 本記事では、私がわからなかったこの eKYC の方式および今後のeKYCのトレンドについて解説したいと思います。 なぜeKYCする? eKYCの方式まとめ ホ方式 新ホ方式(2027年4月〜) ワ方式 ワ方式からカ方式、そしてヲ方式に? ル方式 JPKI方式と比較してのメリット 今後のeKYCのトレンド 📣【宣伝】ワンバンクのeKYCについての発表があります 📚参考資料 なぜeKYCする? まず、なぜ本人確認をしなければならないのでしょうか? 当社は資金決済法に基づく資金移動業の登録を受けており、犯罪収益移転防止法
前回こちらで、大好きなブロガーさんや良記事を紹介しながら、自戒をこめて名文とはこういうものだ!という記事を書きましたが、今回は僕が文章の教科書としている本を紹介します。 ■文章の師匠が見つかれば、半分成功したようなもの 1.毎月新聞 (佐藤雅彦) 毎月新聞 (中公文庫) 作者: 佐藤雅彦 出版社/メーカー: 中央公論新社 発売日: 2009/09 メディア: 文庫 購入: 5人 クリック: 76回 この商品を含むブログ (46件) を見る まず紹介する一冊目は、佐藤雅彦さんのコラム集『毎月新聞』 趣味で文章を書き始めたばかりの大学1年の春、BOOKOFFでたまたまこの一冊を見つけた。 「僕が書きたかったものこれだったのか…!」と衝撃を受け、文章の書き方のイロハをまったくわかっていなかった僕は「こうやって文章を書けば、面白くなるのか!」と大興奮だった。 ちょうどその日、家でむさぼるように読ん
本連載「フリーソフトによるデータ解析・マイニング」は今月号をもって終了となります。 2003年8月に連載第1回として金明哲氏による「データ解析・マイニングとR言語」という記事が掲載されて以来、 約12年半149回に渡り、6名の執筆陣がR言語とデータ解析について解説してきました。 最終回となる今回は、過去10年余りのR言語の国内での普及、 そしてR言語の最新の動向について紹介しながら、有用な情報をピックアップしてみます。 なお今回の記事には著者の主観が多分に反映されていることをご承知おき下さい。 R言語の10余年史 コンピュータのバックアップ履歴を漁ってみたところ、著者自身は大学院生だった2003年頃からRを触り始めて、 2004年夏頃に研究のための分析ツールとしてRを導入していたようです。 この頃のRのバージョンは1.7から1.8だったように記憶しています。 本連載の開始時期と著者のR利用
スポンサーリンク はじめに 実力をつけてハイスコアをとるのが理想ですが、とにかくスコアが必要なんだという人のための参考情報です。 私もどうしても900点以上欲しくて30過ぎのおっさんなりに勉強も頑張ったのですが、最後にこれらの小技に助けられた気がします。 TOEICはとにかく時間との戦いで、全精神エネルギーを出し切る必要があります。試験時間の1秒も無駄にしないように個人的に工夫した小技+αをまとめました。 小技の練習のためにも模擬試験はやっておいた方がいいと思います。 私は前日と前々日に下記の模擬試験をやったんですが、予想スコアの精度がすごいと思いました(実際にとったスコアとの差は10点以内でした)。 TOEICテスト超リアル模試600問[MP3音声付] 作者: 花田徹也出版社/メーカー: コスモピア発売日: 2011/02/25メディア: 単行本(ソフトカバー)購入: 4人 クリック:
小型のパケットキャプチャ装置を売っています、黒ブラといいます。 普段お客様に対して、社内ネットワークの可視化をすると色々分かることがありますよ、というお話をするのですが、具体的に何がどう分かって、どう改善するのかというようなことが短い商談では伝えきれないことがよくあるので、僕の原体験となったある出来事について書き残しておこうと思います。 僕は新卒で商社に入り、情報システム部門に配属されました。 最初に覚えた仕事はPCのキッティングをはじめとするヘルプデスクでしたが、当時新システムの導入が大炎上しており、入社2年目からそのシステム開発のお手伝いに駆り出されました。 ヘルプデスクとSQL開発の2足のわらじで僕の情シスキャリアはスタートします。 システムのリリースが一段落した後、僕はあるサブシステムの運用を任されます。 どういう運用業務かというと、そのシステムがたまに止まるので、データベースの止
はじめに 今週のAKARI Tech Blogは、DX Solution 事業本部 Dev nebulaの西宮が担当します! 今回は、開発している三次元シミュレーションソフトに点群表示を実装する際に行った工夫について紹介します。 開発中のシミュレータの点群表示機能。点群はオープンナガサキを使用建築、都市計画、自動運転など、多くの分野で大規模な点群データを扱う機会が増えています。 しかし、数千万から数十億に及ぶ大規模点群のなかをGoogle Street Viewのように自由に移動しながら表示するには、パフォーマンスの面でいろいろな工夫が必要です。 本記事では、一番簡単でオーソドックスな実装だけではなく、より大規模なシーンをレンダリングするための主要なアプローチをOpenGLでの描画を前提として解説します。 (同じシミュレーションソフトで学習画像を自動生成しSim2Realした例もあります。
最近RustでDNSリゾルバを自作する記事を読んだので、勉強がてらGo言語で書き換えることにしました。 本記事ではまずDNSのプロトコルについてバイナリレベルで解説します。次回の記事でGo言語を使用して実際にDNSパケットのパーサーを作成します。 DNSとは DNSはドメイン名をIPアドレスに名前解決するために使用される通信プロトコルです。 通常、DNSパケットはUDPトランスポートを使用して送信され、512バイトに制限されています。 ただし、TCPで送信することも可能で、eDNSを仕様することでパケットサイズを拡張することもできます。 本記事では従来のUDPによるDNSパケットの送信について解説します。 UDPにおけるDNSパケットの最大長が512バイトである理由 IPv4の仕様では最小パケットサイズとして576バイトと定義されています。 この値は、64バイトのヘッダーと512バイトのデ
こんにちは。ウェザーニューズ モバイル・インターネット事業部の hoka です。 ウェザーニューズにはウェザーニュース アプリユーザーのみなさまにご協力いただき設置しているライブカメラが日本国内に 2000 ヵ所以上あります。ライブカメラの映像を動画理解モデルである Amazon Nova を使って解析し、落雷の検出を試してみました。 録画・検出例 落雷・稲妻がはっきり映っていることがわかります。 落雷の検出例(茨城県 土浦市) 落雷の検出例(石川県 珠洲市) 落雷検出のアプローチ 3 つのステップに分けて処理しています 落雷が発生した地点周辺のライブカメラを録画 映像内で輝度がスパイクした箇所の前後を切り出し Amazon Nova で落雷の有無を解析 Step 1: 落雷が発生した地点周辺のライブカメラを録画 落雷が発生した地点周辺のライブカメラをピックアップして録画しました。落雷の情
型チェッカーの歴史と性能比較について少しだけ掘り下げます
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く