ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Azure Cognitive Search (애저 인지 검색)
    AI&ML 2023. 5. 4. 21:43
    반응형

    Azure Cognitive Search(애저 인지 검색)은 마이크로소프트 애저가 제공하는 클라우드 기반 검색 서비스입니다. 응용프로그램 및 웹 사이트에 강력한 검색 기능을 추가하여 사용자가 관련 정보를 빠르게 찾을 수 있도록 합니다.

    Azure Cognitive Search는 다음과 같은 검색 환경을 사용자 지정할 수 있는 몇 가지 기능을 제공합니다:

    - 인덱스 검색: 텍스트, 숫자 및 지리공간 데이터를 포함하여 검색할 데이터를 정의하는 검색 색인을 만들 수 있습니다.

    - 검색 쿼리: 검색 쿼리를 사용하여 검색 용어, 필터 및 정렬 옵션을 포함한 검색 기준을 정의할 수 있습니다.

    - 스킬 세트: 기술 집합을 사용하여 주요 구문, 엔티티 및 감정 분석과 같은 추가 정보를 데이터에서 추출할 수 있습니다.

    - 인지 서비스: Azure Cognitive Search는 언어 이해(LUIS), 텍스트 분석 및 번역기와 같은 다른 Azure 인지 서비스와 통합됩니다.

    전반적으로, Azure Cognitive Search는 사용자에게 훌륭한 검색 환경을 제공하는 데 도움이 될 수 있는 강력하고 유연한 검색 서비스입니다.

     

    애저 인지 검색은 역인덱싱을 이용하여 데이터를 검색합니다. 여기서 잠간 역인덱싱에 대해서 살펴봅시다.

     

    역인덱싱(Inverted indexing)은 텍스트 검색을 위한 기술 중 하나로, 문서 집합에서 단어를 기반으로 문서를 검색하기 위한 인덱스를 만드는 방법입니다.

     

    역인덱싱은 단어가 포함된 문서들의 목록을 만들어, 이를 검색할 때 빠르게 접근할 수 있도록 하는 것입니다. 예를 들어, 웹 검색에서 "apple"이라는 단어를 검색할 때, 인덱스에 저장된 "apple"이라는 단어를 포함한 모든 문서들을 찾아서 사용자에게 보여줄 수 있습니다.

    역인덱스는 일반적으로 전체 문서 집합을 검색하거나 일부 문서 집합을 검색할 수 있으며, 대규모의 문서 집합에서도 빠르게 검색할 수 있습니다. 또한, 역인덱스는 다양한 검색 기능을 지원하는데, 예를 들어, 부분 검색, 정확도 검색, 그리고 여러 단어의 조합에 따른 검색 등이 가능합니다.

    역인덱싱은 텍스트 검색 기술에서 가장 기본이 되는 기술 중 하나입니다. 대부분의 검색 엔진에서는 역인덱싱을 사용하여 검색 기능을 구현하고 있습니다. Azure Cognitive Search와 같은 클라우드 기반의 검색 서비스도 역인덱싱을 사용하여 효율적인 검색을 지원하고 있습니다.

     

    이외에 애저인지검색은 아래와 같은 검색방식을 지원하여 검색속도를 빠르게합니다.

     

    캐싱: Azure Cognitive Search는 검색 결과 캐싱을 지원하여 성능을 향상시키고 인덱스에 대한 요청 수를 줄입니다. 검색 쿼리가 실행되면 결과가 지정된 시간 동안 캐시에 저장됩니다. 캐시 만료 시간 내에 동일한 쿼리가 다시 실행되면 쿼리를 다시 실행하는 대신 결과가 캐시에서 검색됩니다. 이렇게 하면 특히 자주 실행되는 쿼리의 검색 성능이 크게 향상될 수 있습니다.

    병렬 처리: Azure Cognitive Search는 병렬 처리를 사용하여 작업을 여러 처리 장치에 분산시켜 검색 쿼리 속도를 높입니다. 검색 쿼리가 실행되면 병렬로 실행할 수 있는 더 작은 하위 쿼리로 나뉩니다. 이를 통해 검색 서비스는 기본 하드웨어에서 사용 가능한 처리 능력을 사용하여 쿼리를 더 빠르게 실행할 수 있습니다.

    관련성 순위: Azure Cognitive Search는 관련성 순위 알고리즘을 사용하여 검색 결과가 표시되는 순서를 결정합니다. 관련성 순위 알고리즘은 문서에 검색어가 나타나는 횟수, 문서에서 검색어의 위치, 질의에 대한 문서의 관련성 등 다양한 요인을 고려합니다. 알고리즘을 사용자 정의하여 검색 응용 프로그램의 특정 요구 사항을 충족할 수 있으므로 원하는 검색 결과를 얻기 위해 여러 요인의 상대적 중요도를 조정할 수 있습니다.

     

    위처럼 애저 인지 검색을 사용하는 이유는 많은 형태의 문서 포맷(PDF,TXT,DOC,PPT 등)에 있는 데이터를 빠르게 추출하여 인덱싱을 할수 있다는 것입니다.

     

    반응형

    댓글

Designed by Tistory.