content/release/release-2.25/ja_JP/concepts.html (245 lines of code) (raw):

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <META http-equiv="Content-Type" content="text/html; charset=UTF-8"> <meta content="Apache Forrest" name="Generator"> <meta name="Forrest-version" content="0.9"> <meta name="Forrest-skin-name" content="lucene"> <title>概要</title> <link type="text/css" href="../skin/basic.css" rel="stylesheet"> <link media="screen" type="text/css" href="../skin/screen.css" rel="stylesheet"> <link media="print" type="text/css" href="../skin/print.css" rel="stylesheet"> <link type="text/css" href="../skin/profile.css" rel="stylesheet"> <script src="../skin/getBlank.js" language="javascript" type="text/javascript"></script><script src="../skin/getMenu.js" language="javascript" type="text/javascript"></script><script src="../skin/fontsize.js" language="javascript" type="text/javascript"></script> <link rel="shortcut icon" href="../images/favicon.ico"> </head> <body onload="init()"> <script type="text/javascript">ndeSetTextSize();</script> <div id="top"> <!--+ |breadtrail +--> <div class="breadtrail"> <a href="http://www.apache.org/">Apache</a> &gt; <a href="http://manifoldcf.apache.org">ManifoldCF</a> &gt; <a href="">Release Documentation</a><script src="../skin/breadcrumbs.js" language="JavaScript" type="text/javascript"></script> </div> <!--+ |header +--> <div class="header"> <!--+ |start group logo +--> <div class="grouplogo"> <a href="https://www.apache.org"><img class="logoImage" alt="Apache" src="../images/SupportApache-small-128.png" title="Apache Software Foundation"></a> </div> <!--+ |end group logo +--> <!--+ |start Project Logo +--> <div class="projectlogo"> <a href="http://manifoldcf.apache.org"><img class="logoImage" alt="Apache ManifoldCF" src="../images/ManifoldCF-logo.PNG" title="ManifoldCF"></a> </div> <!--+ |end Project Logo +--> <div class="projectlogo"> <a href="https://www.apache.org/events/current-event.html"><img class="logoImage" src="https://www.apache.org/events/current-event-234x60.png"></a> </div> <!--+ |start Tabs +--> <ul id="tabs"> <li> <a class="unselected" href="..">Hello!</a> </li> <li> <a class="unselected" href="../en_US/index.html">English</a> </li> <li class="current"> <a class="selected" href="../ja_JP/index.html">日本語</a> </li> <li> <a class="unselected" href="../zh_CN/index.html">中文</a> </li> </ul> <!--+ |end Tabs +--> </div> </div> <div id="main"> <div id="publishedStrip"> <!--+ |start Subtabs +--> <div id="level2tabs"></div> <!--+ |end Endtabs +--> <script type="text/javascript"><!-- document.write("Last Published: " + document.lastModified); // --></script> </div> <!--+ |breadtrail +--> <div class="breadtrail"> &nbsp; </div> <!--+ |start Menu, mainarea +--> <!--+ |start Menu +--> <div id="menu"> <div onclick="SwitchMenu('menu_selected_1.1', '../skin/')" id="menu_selected_1.1Title" class="menutitle" style="background-image: url('../skin/images/chapter_open.gif');">日本語</div> <div id="menu_selected_1.1" class="selectedmenuitemgroup" style="display: block;"> <div class="menuitem"> <a href="../ja_JP/index.html">概要</a> </div> <div onclick="SwitchMenu('menu_selected_1.1.2', '../skin/')" id="menu_selected_1.1.2Title" class="menutitle" style="background-image: url('../skin/images/chapter_open.gif');">ドキュメント</div> <div id="menu_selected_1.1.2" class="selectedmenuitemgroup" style="display: block;"> <div class="menupage"> <div class="menupagetitle">概要</div> </div> <div class="menuitem"> <a href="../ja_JP/included-connectors.html">コネクタ一覧</a> </div> <div class="menuitem"> <a href="../ja_JP/faq.html">Q&A</a> </div> <div class="menuitem"> <a href="../ja_JP/javadoc.html">Javadoc</a> </div> <div class="menuitem"> <a href="../ja_JP/technical-resources.html">開発者リソース</a> </div> <div class="menuitem"> <a href="../ja_JP/end-user-documentation.html">エンドユーザマニュアル (HTML)</a> </div> <div class="menuitem"> <a href="../ja_JP/end-user-documentation.pdf">エンドユーザマニュアル (PDF)</a> </div> </div> </div> <div id="credit"></div> <div id="roundbottom"> <img style="display: none" class="corner" height="15" width="15" alt="" src="../skin/images/rc-b-l-15-1body-2menu-3menu.png"></div> <!--+ |alternative credits +--> <div id="credit2"></div> </div> <!--+ |end Menu +--> <!--+ |start content +--> <div id="content"> <h1>概要</h1> <div id="minitoc-area"> <ul class="minitoc"> <li> <a href="#%E6%A6%82%E8%A6%81">概要</a> <ul class="minitoc"> <li> <a href="#ManifoldCF%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%83%A2%E3%83%87%E3%83%AB">ManifoldCFコンテンツモデル</a> </li> <li> <a href="#ManifoldCF%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3%E3%83%A2%E3%83%87%E3%83%AB">ManifoldCFセキュリティモデル</a> </li> <li> <a href="#ManifoldCF%E8%AB%96%E7%90%86%E3%82%A8%E3%83%B3%E3%83%86%E3%82%A3%E3%83%86%E3%82%A3">ManifoldCF論理エンティティ</a> <ul class="minitoc"> <li> <a href="#%E3%82%B3%E3%83%8D%E3%82%AF%E3%82%BF">コネクタ</a> </li> <li> <a href="#%E3%82%B3%E3%83%8D%E3%82%AF%E3%82%B7%E3%83%A7%E3%83%B3">コネクション</a> </li> <li> <a href="#%E3%82%B8%E3%83%A7%E3%83%96">ジョブ</a> </li> </ul> </li> </ul> </li> </ul> </div> <a name="N1000E"></a><a name="%E6%A6%82%E8%A6%81"></a> <h2 class="h3">概要</h2> <div class="section"> <p>ManifoldCFは次のような目的のために設計されたクローラフレームワークです。</p> <p></p> <ul> <li>シャットダウン及び再起動からの回復力に強く信頼性の高いフレームワーク</li> <li>差分更新に対応。収集するコンテンツの条件はジョブに定義します。ジョブを継続的に実行してコンテンツの差分を収集することができます</li> <li>同時に並行して異なるリポジトリの種類と接続してコンテンツを収集することが可能です</li> <li>コンテンツセキュリティに対応しています。ユーザ毎に閲覧可能なコンテンツのみの検索結果が表示されます</li> <li>高速。多くのコンテンツをそれなりの時間内に処理することができます</li> <li>メモリ利用を予測することができます</li> </ul> <p></p> <p>ManifoldCFはリレーショナルデータベースを利用することで多くのアーキテクチャの目的を達成しています。現バージョンはPostgresql、Derby、MySQLに対応しています。その他のデータベースの利用も検討しています。</p> <p></p> <a name="N10035"></a><a name="ManifoldCF%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%83%A2%E3%83%87%E3%83%AB"></a> <h3 class="h4">ManifoldCFコンテンツモデル</h3> <p></p> <p>ManifoldCFの各コンテンツはバイナリデータとそれに関連するメタデータから構成され、ユニークURIに関連付けられています。検索用に組み合わせて利用する検索エンジンはこのモデルに対応する必要があります。</p> <p></p> <p>コンテンツはアクセストークンと関連つけることができます。アクセストークンについては次の節で説明します。</p> <p></p> <a name="N10048"></a><a name="ManifoldCF%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3%E3%83%A2%E3%83%87%E3%83%AB"></a> <h3 class="h4">ManifoldCFセキュリティモデル</h3> <p></p> <p>ManifoldCFセキュリティモデルは、マイクロソフトActive Directoryの認証及び階層のモデルに対応しています。ファイル及びコンテンツの承認/権限にActive Directoryを利用している企業が多いからです。また、Active Directoryは多くの第三者ソフトウエアでも利用されているからです。</p> <p></p> <p>ManifoldCFは<em>アクセストークン</em>という概念を使っています。ManifoldCFでアクセストークンとは、コネクタに内容が依存する文字列です。ユーザにコンテンツを表示するか、表示しないかはこの文字列で制御されます。Active Directoryを利用する場合は、アクセストークンはActive Directory SID(例:S-1-23-4-1-45)です。LiveLinkでは別の意味をもつ文字列になります。</p> <p></p> <p>ManifoldCFセキュリティモデルでは、<em>権限コネクタ</em>が検索を実行したユーザのアクセストークン一覧を作成します。複数の異なるセキュリティで管理されたサーバを検索する場合は、権限コネクタがアクセストークンを組み合わせます。作成されたアクセストークン一覧は検索結果と共に検索エンジンに送られます。検索エンジンはこの情報を元にユーザに表示する内容を制限することができます。</p> <p></p> <p>コンテンツの索引を作成した後に、ManifoldCFはアクセストークンを検索エンジンに送ります。アクセストークンには「許可」と「拒否」の2種類のトークンがあります。なお、アクセストークンはActive Directoryと同様に「共有」,「フォルダ」,「ファイル」にセキュリティを設定することができます。</p> <p></p> <p>検索エンジンはアクセストークンの内容に基づき表示する検索結果の内容を決めます。検索エンジンにSolr 1.5を利用される場合はこの処理を標準で行えるようにするためにApache SolrプロジェクトにSearchComponentプラグインとそれを利用する説明書を提供しています( <a href="https://issues.apache.org/jira/browse/SOLR-1895">SOLR-1895</a>)。</p> <p></p> <a name="N10074"></a><a name="ManifoldCF%E8%AB%96%E7%90%86%E3%82%A8%E3%83%B3%E3%83%86%E3%82%A3%E3%83%86%E3%82%A3"></a> <h3 class="h4">ManifoldCF論理エンティティ</h3> <p></p> <a name="N1007C"></a><a name="%E3%82%B3%E3%83%8D%E3%82%AF%E3%82%BF"></a> <h4>コネクタ</h4> <p></p> <p>ManifoldCFには次の3つのコネクタがあります:</p> <p></p> <ul> <li>権限コネクタ</li> <li>リポジトリコネクタ</li> <li>出力コネクタ</li> </ul> <p></p> <p>すべてのコネクタには共通した機能があります。先ず、すべてのコネクタはプールされています。ManifoldCFは設定したコネクタのインスタンスを管理します。インスタンス数の上限を設定することもできます。コネクタの実装はManifoldCFが管理するプール内で自身を管理するためのメソッドを実装しています。コネクタは設定可能です。コネクタの設定はコネクタの実装に依存したXML文で行えます。ManifoldCFでは、設定されたコネクタのインスタンスを<em>コネクション</em>と呼びます。</p> <p></p> <p>コネクタは次のような機能をもちます:</p> <p></p> <table class="ForrestTable" cellspacing="1" cellpadding="4"> <tr> <th colspan="1" rowspan="1">コネクタタイプ</th><th colspan="1" rowspan="1">機能</th> </tr> <tr> <td colspan="1" rowspan="1">権限コネクタ</td><td colspan="1" rowspan="1">リポジトリに意味あるようにユーザ名とアクセストークンを対応づける</td> </tr> <tr> <td colspan="1" rowspan="1">リポジトリコネクタ</td><td colspan="1" rowspan="1">指定されたリポジトリ(例:SharePointやWeb)からコンテンツを収集する</td> </tr> <tr> <td colspan="1" rowspan="1">出力コネクタ</td><td colspan="1" rowspan="1">収集したコンテンツと処理(追加や削除など)をバックエンド検索エンジン又はLuceneのようなエンティティに送信する</td> </tr> </table> <p></p> <a name="N100D2"></a><a name="%E3%82%B3%E3%83%8D%E3%82%AF%E3%82%B7%E3%83%A7%E3%83%B3"></a> <h4>コネクション</h4> <p></p> <p>上で説明した通りに、<em>コネクション</em>とはコネクタの実装とコネクタ固有の設定情報です。Webブラウザからこれらの設定を行うことができます。</p> <p></p> <p>コネクタには「何を」よりも「どのように」という情報を設定します。例えば、LiveLinkコネクションにはLiveLinkサーバと接続の仕方を設定します。どの文書ファイルを収集するかのような情報は設定しません。</p> <p></p> <p> <em>リポジトリコネクション</em>と<em>権限コネクション</em>及び出力コネクションの設定は異なります。リポジトリコネクションには、権限コネクションを設定します。ManifoldCFが収集する<strong>すべて</strong>の文書は適切なアクセストークンが必要だからです。</p> <p></p> <a name="N100F5"></a><a name="%E3%82%B8%E3%83%A7%E3%83%96"></a> <h4>ジョブ</h4> <p></p> <p>ManifoldCFで<em>ジョブ</em>とは、指定したリポジトリコネクションと出力コネクションの同期をとるための情報です。ジョブには次の情報を含みます:</p> <p></p> <ul> <li>詳細説明</li> <li>リポジトリコネクション(暗黙的に権限コネクションを含む)</li> <li>出力コネクション</li> <li>リポジトリコネクションに特定したジョブが対象とするコンテンツとメタデータの説明</li> <li>クロールモデル:「最後まで実行」又は「継続実行」</li> <li>ジョブの実行スケジュール:指定された時間帯または即時</li> </ul> <p></p> <p>複数のジョブで同じリポジトリコネクションを使うことができます。即ち、ManifoldCFでは複数のジョブで同じ文書を収集するように設定することを許可していますが、普通は同じ文書を異なるジョブで収集しないように設定します。</p> </div> </div> <!--+ |end content +--> <div class="clearboth">&nbsp;</div> </div> <div id="footer"> <!--+ |start bottomstrip +--> <div class="lastmodified"> <script type="text/javascript"><!-- document.write("Last Published: " + document.lastModified); // --></script> </div> <div class="copyright"> Copyright &copy; 2009-2024 <a href="http://www.apache.org/licenses/">The Apache Software Foundation.</a> </div> <div class="copyright"> Apache ManifoldCF, ManifoldCF, Apache Forrest, Forrest, Apache Solr, Solr, Apache, the Apache feather logo, the Apache Forrest logo, and the Apache ManifoldCF logo are trademarks of The Apache Software Foundation. Documentum and EMC are a trademarks of EMC Corporation. SharePoint, Windows, and Microsoft are trademarks of Microsoft, Inc. FileNet P8 and IBM are trademarks of IBM, Inc. LiveLink and OpenText are trademarks of OpenText, Inc. QBase, MetaCarta, and GTS are trademarks of QBase, Inc. Meridio and Autonomy are trademarks of Hewlett Packard, Inc. Alfresco is a trademark of Alfresco Software, Inc. Jira is a trademark of Atlassian, Inc. </div> <!--+ |end bottomstrip +--> </div> </body> </html>