본문 바로가기

Interview2

[Elastic Search] 역인덱스 엘라스틱서치(Elasticsearch)에서 역인덱스(inverted index)는 데이터를 효율적으로 검색할 수 있도록 구성된 핵심 구성 요소입니다. 역인덱스는 주어진 검색어에 대한 문서를 빠르게 찾기 위해 사용됩니다. 즉, 키워드를 통해 문서를 찾아내는 방식입니다. 1. 문서 색인(Indexing): 엘라스틱서치에서 문서가 색인될 때, 문서의 각 단어는 해당 단어가 나타난 문서 ID와 함께 역인덱스에 추가됩니다. 2. 토큰화(Tokenization): 문서의 텍스트는 토큰화되어 개별 단어로 분할됩니다. 예를 들어, "The quick brown fox"라는 문장은 "The", "quick", "brown", "fox"로 토큰화됩니다. 3. 어휘(Vocabulary) 구성: 모든 문서에서 발견된 고유한 .. 2024. 2. 10.
[DB] 정규화와 비정규화 1. 정규화란? 데이터베이스 설계에서 중복을 최소화하고 데이터 일관성을 유지하기 위해 데이터를 구조화하는 프로세스입니다. 주로 관계형 데이터베이스에서 사용되며, 관련 테이블 간의 종속성을 제거하여 데이터 무결성을 향상 정규화의 목적: 중복 제거: 데이터베이스에 중복된 데이터를 피하여 저장공간을 절약하고 데이터 일관성을 유지합니다. 삽입, 갱신, 삭제 이상 방지: 데이터가 갱신되거나 삭제될 때 발생할 수 있는 이상 현상을 최소화합니다. 검색 효율 향상: 쿼리의 성능을 향상시켜 데이터 검색 속도를 개선합니다. 2. 비정규화란? 비정규화는 데이터베이스 설계에서 정규화된 데이터 모델을 일부로 건너뛰거나 조정하여 성능을 향상시키는 프로세스입니다. 정규화된 데이터 모델은 중복을 최소화하고 데이터 일관성을 유지하기 .. 2024. 2. 10.