본문 바로가기

개발 관련 공부/빅데이터응용4

Information Retrieval (끝) 이 포스트는 2021.12~2022.09 기간동안 벨로그에 작성한 글을 티스토리에 옮겨 적은 것입니다. Information Retrieval Systems Information retrieval (IR) systems은 데이터베이스 시스템보다 더 simpler data model을 사용한다. ✔ information은 문서들의 collection으로 구성됨. ✔ 문서들은 unstructured이고 schema 없음 Information retrieval 사용자 입력 키워드를 이용해 관련 문서를 찾는다. IR시스템의 가장 대표적인 예: Web search engines Differences from database systems IR시스템은 transactional update을 처리하지 않는다.( co.. 2022. 9. 12.
Data Analytics 이 포스트는 2021.12~2022.09 기간동안 벨로그에 작성한 글을 티스토리에 옮겨 적은 것입니다. DATA WAREHOUSING Data warehouse는 multiple sources에서 모든 정보들을 저장하는 저장소이다. 단일 사이트에 통합된 스키마로 저장되며, historical data를 포함하므로 과거 트렌드에 대한 연구가 가능하다. Design Issues Source driven architecture: data src가 새 정보를 data warehouse로 보낸다. Destination driven architecture: data warehouse가 data src에게 새 정보를 요청한다. 웨어하우스와 data src를 정확하게 동기화(synchronized)하는 것은 사실 너무.. 2022. 9. 12.
Advanced SQL 이 포스트는 2021.12~2022.09 기간동안 벨로그에 작성한 글을 티스토리에 옮겨 적은 것입니다. Advanced Aggregation Feature Ranking select ID, rank() over (order by GPA desc) as s_rank from student_grades order by 절을 적용할 수 있다. select ID, rank() over (order by GPA desc) as s_rank from student_grades order by s_rank gap을 없애고 싶으면 dense_rank 사용 select ID, dense_rank() over (order by GPA desc) as s_rank from student_grades row number 쓰고.. 2022. 9. 12.
DatabaseEssentials 이 포스트는 2021.12~2022.09 기간동안 벨로그에 작성한 글을 티스토리에 옮겨 적은 것입니다. Storage and Indexing Oracle에서 데이터베이스는 file에 저장된 information로 구성되고 instance에 의해 접근됨. Instance: data file과 상호작용하는 shared memory area and set of processes Table Spaces 데이터베이스는 table space라고 불리는 한 개 이상의 logical storage unit으로 구성된다. 각 table space는 data file이라 불리는 physical space로 구성된다. Oracle table space -system table space -user table spaces -.. 2022. 9. 12.
반응형