Commits

Shoji KUMAGAI  committed 63a39e9

2010.10.22 shkumagai Add some sentence translation.

  • Participants
  • Parent commits b780550

Comments (0)

Files changed (1)

File source/chapter01/an_example_information_retrieval_problem.rst

 基本について紹介します。それぞれの文書(ここではシェイクスピアの戯曲)が、シェイクスピアが用いた\
 全ての単語(シェイクスピアはおよそ32,000の異なる単語を用いている)のほかに、それぞれの単語を\
 含むかどうかを記録すると仮定しましょう。結果は図1.1のようなバイナリ形式の、用語とドキュメントの\
-出現率マトリックスになります。タームは索引付けが行われる単位(これについては2.2節で詳しく触れます)\
+出現率の行列になります。タームは索引付けが行われる単位(これについては2.2節で詳しく触れます)\
 で、これは通常は単語であることがほとんどなので、当面は単語だと考えて構いませんが、情報検索の\
-文脈ではI-9やHong Kongのように、通常では単語と考えないようなものを *ターム* と表現します。
+文脈ではI-9やHong Kongのように、通常では単語と考えないようなものを *ターム* と表現します。\
+表の行と列のどちらから見るかによって、文書中に現れるタームの傾向、またはタームが含まれる文書の\
+傾向のいずれも把握することができます。 [2]_
 
 .. Figure 1.1
    A term-document incidence matrix. Matrix element (t, d) is 1 if the play in column d contains
 .. To answer the query Brutus AND Caesar AND NOT Calpurnia, we take the vectors for Brutus,
    Caesar and Calpurnia, complement the last, and then do a bitwise AND:
 
+"Brutus AND Caesar AND NOT Calpurnia" という問い合わせに答えるためには、"Brutus", "Caesar" そして\
+"Calpurnia" のベクトルを取り、桁を合わせてからANDビット演算(論理積)を行います:
+
    110100 AND 110111 AND 101111 = 100100
 
 .. The answers for this query are thus Antony and Cleopatra and Hamlet (Figure 1.2).
    We will see why this is useful in Section 1.3, below, but later we will also consider
    alternatives to doing this (Section 7.1.5).
 
-.. [2] Formally, we take the transpose of the matrix to be able to get the terms as column
+.. .. [2] Formally, we take the transpose of the matrix to be able to get the terms as column
        vectors.
+.. [2] 正式には、列ベクトルを得られるように行列の転置を行う。
 
 .. [3] Some information retrieval researchers prefer the term inverted file, but expressions
        like in dex construction and index compression are much more common than inverted file