There are some useful tools or package for IR research ,
I list what I know as below
Mulan
Mulan can help us to train classifier.
JerryCheng 發表在 痞客邦 留言(0) 人氣(39)
2011/02/09
Clickthrough data
Clickthrough data in search engines can be thought of as
triplets (q , r , c) consisting of the query q , the ranking r
JerryCheng 發表在 痞客邦 留言(0) 人氣(52)

Informedia Digital Video Library 是一種以Video為data組成的library,
它使用了speech , Image and natural language understanding來對
Video進行處理,而主要的目標即是希望Video能夠以類似Text的檢索方法來
進行檢索.
JerryCheng 發表在 痞客邦 留言(0) 人氣(45)
1.Precision & Recall
2.F-Score
3.ROC Curve ( Receiver Operatng Characteristics)
4.Area under the ROC curveJerryCheng 發表在 痞客邦 留言(0) 人氣(3,191)
1.Marcov Property
2.ergodic
3.steady-state probability
Marcov chain是一種離散隨機過程(discrete stochastic process),
JerryCheng 發表在 痞客邦 留言(0) 人氣(62)

Meta-Search Engine,跟一般的serach engine不同(ex: yahoo,google...etc),
Meta-Search Engine是接收user下的query後,將這個query在傳送給各個search engine,
再將每個search engine的結果總結,回傳所有result給user.
以下為一個meta-search engine的example.
JerryCheng 發表在 痞客邦 留言(0) 人氣(323)
NDCG (normalize discount cumulative gain)
一般在衡量一個retrieve的方法是否好不好時,通常會去判斷其 P-R curve,
即計算每個relevance level的average precision,
但在判斷時面對此document是否relevance時,
JerryCheng 發表在 痞客邦 留言(2) 人氣(3,654)