Rainbow Engine

IT技術を分かりやすく簡潔にまとめることによる学習の効率化、また日常の気付きを記録に残すことを目指します。

Azure Microsoft

Azure Blob Storageでファイル検索(セマンティック検索)する方法

投稿日:2023年9月13日 更新日:

 

<目次>

Azure Blob Storageでファイル検索(セマンティック検索)する方法
 やりたいこと/概要
 STEP1:Azure AI Search(旧称:Azure Cognitive Search)リソースの作成
 STEP2:データのインポート
 STEP3:インデックスの作成
 STEP4:「セマンティック構成」の設定
 STEP5:インデクサーの設定
 STEP6:クエリの実行(検索テスト)
 STEP7:Pythonプログラムから検索を行う
 補足(料金体系)

Azure Blob Storageでファイル検索(セマンティック検索)する方法

(※注意)「Azure Cognitive Search」は2023年11月15日に「Azure AI Search」に改称されました。価格体系やサービス内容に変更はないようです

やりたいこと/概要

●やりたいこと
・Azure Blob Storageにある様々な形式のデータ(テキスト、音声、画像)を検索できるようにする
 
●概要
「Azure AI Search」(旧称:Azure Cognitive Search)のセマンティック検索は、MicrosoftのAIを使用して検索結果を再スコアリングし、セマンティック関連性の高い結果をリストの先頭に移動する機能です。
 
これにより、検索結果にセマンティックの関連性と言語理解が取り込まれ、最も意味の関連が高い結果が上位に昇格します。
 
また、セマンティック検索は、以下のを機能群を指します。
・①セマンティックランキング
→ 検索クエリの意味を理解し、関連性の高い検索結果をランキングする機能。
・②セマンティックアンサー
→ 検索結果の上に表示される、クエリに直接”回答”するコンテンツを抽出する機能
・③セマンティックキャプション
→ 検索結果のキャプションを生成する機能で、結果の文脈を理解し、その内容を簡潔に要約します。
・④セマンティックハイライト
→ 検索結果内の重要な箇所をハイライトし、ユーザーが必要な情報を迅速に見つけられるようにする機能。
 
(参考)

STEP1:Azure AI Search(旧称:Azure Cognitive Search)リソースの作成

・①左側のナビゲーション メニューで「リソースの作成」を選択します。
(図111)
・②「新規」ページで「検索」を検索し、検索結果で「Azure AI Search」(旧称:Azure Cognitive Search)を選択します。
(図112①)
(図112②)


・③「新規検索サービス」ページで、以下の設定を行います。
 
(表)
サブスクリプション Azure サブスクリプションを選択します。
リソース グループ 既存のリソース グループを選択するか、新しいリソース グループを作成します。
URL サービスに一意の URL を指定します。URL はグローバルに一意である必要があります。
場所 データの地理的な場所を選択します。
価格レベル 価格とパフォーマンスのオプションを選択します。

(図113)

・④「作成」を選択してリソースを作成します。

(図114①)
(図114②)
 

STEP2:データのインポート

・①事前にAzure Blob Storageを用意しておきます。
(図411①)
(図411②)

・②「+データソースの追加」をクリックし、「新しいデータ ソース」フォームに必要な情報を入力します。
(図412①)
・③データ ソースの種類として「Azure Blob Storage」を選択し、必要な情報(ストレージ アカウント、接続文字列、コンテナ名など)を入力します。
(図412②)
(図412③)
 

STEP3:インデックスの作成

検索エンジンが情報を迅速に検索できるようにするためのデータ構造です。
 
・①「インデックスの追加」を選択
(図211)
・②必要な情報を入力し、インデックスを作成します。
(図212)
(図213)
 

STEP4:「セマンティック構成」の設定

・①「セマンティック構成」
(図311)
・②「作成」
(図312)
・③タイトル、コンテンツを指定して作成
(図313①)

(表)

タイトルフィールド ・ドキュメントのタイトルまたは主題を表すフィールドを指定します。
・検索結果のランキングに影響を与え、また検索結果のキャプションに使用されます。

(例)ニュース記事のデータセットの場合、記事のタイトルを表すフィールドをタイトルフィールドとして指定する。

コンテンツフィールド ・ドキュメントの本文または主要な内容を表すフィールドを指定します。
・検索結果のランキングに影響を与え、またセマンティックキャプションやセマンティックハイライトに使用されます。

(例)ニュース記事のデータセットの場合、記事の本文を表すフィールドをコンテンツフィールドとして指定する。

・④「保存」
(図313②)

STEP5:インデクサーの設定

・①「インデクサー」を選択し、「+追加」をクリックします。
(図413)

・②「新規インデクサー」フォームに必要な情報を入力し、「作成」をクリックしてインデクサーを作成します。
→保存押下で実行される
(図414①)
(図414②)

(図414③)

STEP6:クエリの実行(検索テスト)

・①「検索エクスプローラ」を選択し、検索ボックスに検索クエリを入力し、「検索」をクリックします。
(図511)
・②検索結果が表示されます。
 
(図512)

STEP7:Pythonプログラムから検索を行う

補足(料金体系)

(表)

Free プラン ・無料で使用できますが、リソースの使用量に制限があります。
・50MBまでのストレージ
・3つまでのインデックス
Basic プラン ・2GBまでのストレージ
・5つまでのインデックス
Standard プラン ・より大量のデータとインデックスを扱える
・ストレージ容量は、価格レベルによりますが、最大で2.4TBまで利用可能。
・インデックスの数も無制限
Storage Optimized プラン ・大量のデータを扱うことができます。
・最大で12TBのストレージ
・無制限のインデックス

目次にもどる

Adsense審査用広告コード


Adsense審査用広告コード


-Azure, Microsoft
-

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

Azureアカウントの作成方法と概要について

  <目次> (1) Azureアカウントの作成方法と概要について  (1-1) Azureアカウントの概要  (1-2) Azureアカウント作成手順   ①:Azureサイトにアクセス …

Azureリソースグループの作り方の手順について

  <目次> (1) Azureリソースグループの作り方の手順について  (1-1) Azureリソースグループとは?  (1-2) Azureリソースグループの作成手順  (1-3) Az …

Azure Cosmos DBの使い方入門(作成~データ登録~SQL発行)

  <目次> (1) Azure Cosmos DBの使い方入門(作成~データ登録~SQL発行)  (1-0) Azure Cosmos DBとは?  (1-1) STEP1: Cosmos …

Microsoft Azureとは?概要や特徴および利用方法についての解説

(0)目次&概説 (1) Azureとは?  (1-1) IaaSとは?  (1-2) PaaSとは?  (1-3) IDaaSとは? (2) Azureのデータセンター  (2-1) Azureのデ …

OneDriveで複数のアカウントをエクスプローラー同期する手順

  <目次> (1) OneDriveで複数のアカウントをエクスプローラー同期する手順  (1-1) 前提事項  (1-2) 設定手順  (1-3) 余談(OneDriveの豆知識) (1) …

  • English (United States)
  • 日本語
Top