アフィリエイト広告を利用しています

広告

この広告は30日以上更新がないブログに表示されております。
新規記事の投稿を行うことで、非表示にすることが可能です。
posted by fanblog

Windows Searchを使ってみる5

ある程度検索キーワードの部分が分かってきたところで、出力項目に何があるのかさっぱり。


System.ItemPathDisplay ファイルパス
System.ItemUrl     ファイルパス
System.FileName    ファイル名
System.Kind      ファイルの種類


ItemPathDisplay と ItemUrl の差が謎なんですが、出力すると、

wssql4.png

ファイルの種類も出てくるみたいで、ネットワークパスなんかが出るらしい。謎。

System.Search.AutoSummary 先頭から1000文字抜粋
System.Search.Rank     検索ワードとの一致率 

あとわかったのはこの2つ。
WSSQL サンプルは一致したファイル名しか出ないので、AutoSummary を指定することで
中身が少し見えるのでワードとかいちいち開かなくていいのでこれは使えますねー。

あとまだあるのかなー。さっぱり。


Windows Searchを使ってみる4


Contains と FreeText の違いがあるみたいで、マニュアル探してみたら。


CONTAINS/CONTAINSTABLE
完全一致またはあいまい一致 (より低い精度での一致) する単語または語句を照合できます。
次の操作を行うこともできます。
単語が互いに特定の範囲内でどれくらい近いかを指定する。
一致するものを重み付きで返す。
論理演算子で検索条件を結合する。 詳しくは、この記事の後半の「ブール演算子 AND、OR、および NOT の使用」をご覧ください。

FREETEXT/FREETEXTTABLE
指定した単語、語句、または文章 ("freetext 文字列") の正確な文字列の並びではなく、意味を照合できます。
指定した列のフルテキスト インデックスに、用語または一定の形式の用語が見つかった場合は、一致すると判断されます。


よくわからん。。。
まぁ単語、語句じゃないとどっちもダメっぽいって感じですかね。
じゃあエクスプローラーの検索はどうやってるんだろかってねー。

Contains と FreeText の大きな違いが分かったのは、

FREETEXT は ワイルドカード検索が出来ないみたいです。。。
だけど複数語句を入れて検索してもいける。

freetext("あいまい テスト")  はOK。
contains("あいまい テスト")  はNGというか、空白込みで検索するみたい。

freetext("あ* ")  はNG
contains("あ* ") はOK

複数キーワードであいまい検索(ワイルドカード検索)を使うには
contains が良いみたい。。。

入力されたキーワード分けてcontains を and で繋ぐしかないみたいですなぁ。

contains("あ*") and contains("テ*")
という感じでいけそうです。

もうちょっと頑張るかぁ。









Windows Searchを使ってみる3

前回検索結果がなんか違うなぁって感じに書いて、何が違うかって言うと、

WSSQLのコマンドで「サイズ」と「サ」を検索した結果が以下

wssql2.png

「サイズ」で2つファイルがヒットしました。
「サ」ではヒットしませんでした。

以下が、エクスプローラーでの「サイズ」と「サ」の検索結果

wssql1.png
wssql3.png

「サイズ」も「サ」も検索できてるね。。。

この違いにしばらく悩みました。同じデータベースのはずなので、SQLが違うのだろうなと。

色々と調べると contains と freetext があるってことがわかりました。

この違いを探ってみることに。








Windows Searchを使ってみる2

Windows Searchを使うために検索してサンプルコードを探していたら

意外とMicrosoftがサンプル出してた。。。最近のMicrosoftは優しいな。

やりたいことに近いのは WSSQL ってサンプル。

GitHub

とりあえずビルドしてみたらコマンドラインベースであればそのまま検索SQLを

動作させることができました!

でも、なんか違う・・・


Windows Searchを使ってみる

WordやExcelが入っているフォルダに対して全文検索したいとのオーダー。

他社見積もりで、「データベースサーバー構築したほうが」って話になって

300万オーバー見積もり。

うん、無理ゲーですよね。

最初はエクスプローラーの検索使うのでどうだろか打診。

「要件は満たしてるけど、字が小さい」

さぁどうする。。。

全部テキストファイルに落とし込んで検索させたらどうだろかと思いましたが、

500ファイルぐらいあるみたいで、変換だけでも面倒。

修正も頻繁みたいだし、顧客にしてみたらwordやexcelのほうが操作に慣れてる。

ネットで調べて全文検索とかしたら、wordとかを片っ端から開けて検索して閉じる。

毎回500ファイルは無理だろな。

いろいろ調べてたら WIndows Search ってのでエクスプローラーの検索データベースに

アクセスできるみたいなこと書いてる英語ページ見つけたんで頑張って解析だー!




   
×

この広告は30日以上新しい記事の更新がないブログに表示されております。