[go: up one dir, main page]

タグ

morphologicalに関するtakadoのブックマーク (9)

  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ

    takado
    takado 2008/05/05
    「Googleではどうかというと、Basis Technology社が提供する商用の形態素解析を使っているようです」
  • テキスト変換(笑)

    テキストを解析し、適宜「(笑)」を追加します。 Web2.0で愛されモテカワスイーツな次世代ウェブサービスです。 例:Web2.0で愛されモテカワ… 入力されたテキストに対して MeCab で形態素解析を行い、 名詞連続の最後に「(笑)」を挿入するという単純なロジックです。 簡易版もあります。ソースコードも公開中。 関連記事:テキスト変換(笑)を堂々公開(笑)(たつをの ChangeLog

    テキスト変換(笑)
    takado
    takado 2007/12/03
    「入力されたテキストに対して MeCab で形態素解析を行い、名詞連続の最後に「(笑)」を挿入」
  • Yahoo 日本語形態素解析Webサービスを使ってしりとりをしてみよう

    ドメインウェブの設定が見つかりません 考えられる原因 ドメインウェブの設定がまだ行われていない。 ドメインウェブの設定がまだ反映されていない。(反映には数時間〜24時間かかることがあります) ドメインウェブ・DNSの設定が誤っている。

    takado
    takado 2007/06/27
    Yahooの形態素解析APIでしりとり
  • Yahoo!デベロッパーネットワークにテキスト解析APIが登場!

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場! 2007-06-18-1 [WebTool][NLP][MECAPI][Programming] Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。 第一弾は日形態素解析APIです。 ヤフーのいろんなところに使われている WebMA という 形態素解析エンジンのAPIです。 - Yahoo!デベロッパーネットワーク - テキスト解析 - 日形態素解析 http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html MECAPI の仕様に似ていますが、まあそういうものです。 (MECAPI https://maapi.net/) で、先日 MECAPI で作った「文で検索」[2007-04-03-1]の WebMA 版を作ってみました。「文で検索2」

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場!
  • どんなページもルー大柴ナイズ

    来月仕事海外に行くことになりそうなので、買っただけで読んでなかった カタカナ英語 を取り出して読んでたのですが、TV 付けて酒飲みながらじゃあ勉強にならない。カタカナ英語といえば ルー大柴 だよなあ、と脱線しはじめる。 「ディスイヤーは私にとって再チャレンジのファンデーション作りのイヤーだった」(原文) ↓ 翻訳すると「今年は私にとって再挑戦の基礎作りの年だった」 ということは何か普通の文章をルー化するスクリプトをすぐ書けそうな予感。ルーさんが使いそうな単語を片っ端からマップにしてもいいけど、それはめんどい。それより、文章を形態素解析 → 単語を英訳 → 英語をカタカナ読みに翻訳 → というようにすれば楽に書けるんじゃないか?と発展。 形態素解析は MeCab でいいよね 単語の和英は、Excite みたいなネットを介すやつだと遅いので、フリーの英和辞書を探す。EDICT proje

    どんなページもルー大柴ナイズ
    takado
    takado 2007/01/01
    インタレスティング
  • KH Coder

    ************************************************************ THIS PROJECT IS MOVED. See http://khcoder.net/en for the latest & greatest. You can download this tool from the new home. See you there! ************************************************************

    takado
    takado 2006/12/06
    ChaSen + MySQL + Perlで内容分析テキストマイニングを行うリーソフトウェア
  • [を] MECAPI (MeCab API) 暫定版を公開

    MECAPI (MeCab API) 暫定版を公開 2006-09-18-1 [WebTool][NLP][MECAPI] taku-ku 氏による日形態素解析器 MeCab の Web Service を 作ってみたので公開します。その名も MECAPI (メカピ)! - MECAPI - MeCab Web Service (MeCab API) http://mimitako.net/api/mecapi.cgi Perl の MeCab モジュールを使っています[2006-02-25-4]。 仕様は今後変わっていく可能性あり。 また、サーバ負荷によっては予告なく止めることもあり。 同一 IP からの回数制限とかするかも。 とりあえずしばらく様子を見て、落ち着いたらソースを公開します。 でもって、余裕のあるサーバに置いてもらいたいと思っています。 現段階で、

  • エブログ マルコフ連鎖で文章生成(JavaScript)

    マルコフ連鎖で文章生成(JavaScript) マルコフ連鎖による文章生成。マルコフ連鎖と言っていいのかあまり自信はないのだが、とりあえず文章を作ってはいる感じ。 テキストエリアに入力された文章を解析して、その中の単語を使って、自動生成します。文章生成ボタンを何度か押すと文章が変わっていくと思います。 意味不明であったり、そのままの文、同じ文が続けて出たりはしてしまいますが。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛を吹き、羊と遊んで暮して来た。けれども邪悪に対しては、人一倍に敏感であった。きょう未明メロスは村を出発し、野を越え山越え、十里はなれた此(こ)のシラクスの市にやって来た。 ここに文章が作成されます。 posted by knit at 19:45 | Comment(9)

    エブログ マルコフ連鎖で文章生成(JavaScript)
    takado
    takado 2006/08/21
    Javascriptだけで構文解析+マルコフ連鎖による文章生成.おもしろい
  • 人工無能を作ろう〜マルコフ連鎖(perl)

    perlでChaSenを使って形態素解析&「1語の接頭語+1語の接尾語」のマルコフ連鎖をする際のサンプルです。 プログラムの文字コードはEUC-JPで、CGIとして実行できブラウザから実行結果を確認できるように書いてます。 perlからChaSenを使う場合、Text::ChaSenなど便利なモジュールもあります。 しかし、利用する形態素解析ツールが変わった場合にも簡単に対応出来るようにする為、Text::ChaSenを使わない方法で書きます。 下記ソースは汚染チェック・エラーチェック等を行ってませんので、ご利用の際にはご注意下さい。 #!/usr/bin/perl -w # ChaSenのパス $chasen = '/usr/local/bin/chasen'; # 形態素解析を行う文章 $str = "当の優しさとはどんなことなのだろうか。相手がして欲しい事に気づいてあげら

  • 1