技術情報 レーベンシュタイン距離で文字列の類似度を測る 過去にネットで見かけてその存在だけは知っていたレーベンシュタイン距離について追ってみます。編集距離 (Levenshtein Distance) - naoyaのはてなダイアリーすでにrubyで実装されている方がいらっしゃったので、それを使... 2011.11.18 山平 技術情報
技術情報 N-gramで文字列の類似度を測る とある2つの文字列がどれぐらい似ているのかを比較するにはどうすればいいのかを調べる必要があったので、ネットで検索してみました。perlにはString::Trigramというモジュールがあるようです。String::Trigram でテキス... 2011.11.04 山平 技術情報