Pinterest 데이터를 사용하여 추천 모델을 구현해보려고 하는데 파일 확장자가 bson이더라. 몽고 DB에서 쓰는 binary json 확장자라고 하는데 파이썬에서 pymongo 패키지를 깔아 읽을 수 있다.
패키지 인스톨
bson 패키지가 아닌 pymongo 를 깔아야 함
$ pip install pymongo
데이터 로드
import bson
with open('subset_iccv_board_pins.bson'), 'rb') as f:
data = []
for rows in bson.decode_file_iter(f):
data.append(rows)
데이터 열어보기
바이너리인 것 외에는 json과 별 차이 없는 듯
{'_id': ObjectId('56c7caece4b0fd248a857cbc'),
'board_url': '/tressamorrison/home/',
'board_id': '119134421331766936',
'pins': ['119134352618674646',
'119134352618662252',
'119134352618656367',
'119134352618650870',
'119134352618446617',
'119134352618440692',
'119134352618427540',
'119134352618423757',
'119134352618416078',
'119134352613427201',
'119134352613427199',
'119134352613427192',
'119134352613427188',
'119134352613427166',
'119134352613427161',
'119134352613126372',
'119134352612827413']}
반응형
'CS' 카테고리의 다른 글
fish shell 터미널 디렉토리 출력 색 변경 (0) | 2023.07.14 |
---|---|
docker sudo 없이 실행하기 (docker group 지정) (0) | 2023.07.13 |
파이썬에서 SSH 터널링과 mysql 커넥션 풀을 통해 DB 접속하기 (0) | 2023.07.10 |
vimrc 설정하기 (0) | 2023.07.05 |
bipartite 그래프 간단하게 시각화하기 (0) | 2023.06.30 |