SS테이블은 각 세그먼트 당 데이터들이 고유해야 하는 것이 맞나? 컴팩션했을 당시에만 고유하면 되는것인가?

b트리 최적화 중 페이지 덮어쓰기와 고장 복구 대신에 쓰기 시 복사를 하게 될 경우, 데이터 량이 증가할 거 같은데 이를 어떻게 했을까?

데이터 웨어하우스와 데이터 레이크의 차이점? 데이터 웨어하우스도 큰 데이터들을 다루는 건데 데이터 레이크와 차이는 무엇인가? 원본 데이터를 가지고 있으면 되는건가?

OLTP에 있는 데이터를 OLAP쪽으로 어떻게 가져오면 좋을것인가? 로그에 데이터를 담아서 전송하는 것은 개인정보 노출에 위험이 있어 보이는데 어떻게 하는게 좋을지 궁금 배치를 돌리는 것이 안전할까? 카프카를 통해서 데이터 전송?

칼럼지향방식에 대해 좋은 거 같다고 생각됨. 데이터 저장이 아닌 코드상에서는 어떻게 쓰면 좋을것인가? json과 같은 포멧은 로우 지향방식이라고 생각이 드는데 이를 apache arrow와 같은 데이터 포맷으로 바꾸는 것이 좋을까?

이런 데이터들을 가지고 활용에 있어서 압축은 어떻게 하면 좋을것인가?