본문 바로가기
CS

파이썬 bson 파일 열기

by judy@ 2023. 7. 11.

Pinterest 데이터를 사용하여 추천 모델을 구현해보려고 하는데 파일 확장자가 bson이더라. 몽고 DB에서 쓰는 binary json 확장자라고 하는데 파이썬에서 pymongo 패키지를 깔아 읽을 수 있다.

 

패키지 인스톨

bson 패키지가 아닌 pymongo 를 깔아야 함

$ pip install pymongo

 

데이터 로드

import bson

with open('subset_iccv_board_pins.bson'), 'rb') as f:
    data = []
    for rows in bson.decode_file_iter(f):
        data.append(rows)

 

데이터 열어보기

바이너리인 것 외에는 json과 별 차이 없는 듯

{'_id': ObjectId('56c7caece4b0fd248a857cbc'),
 'board_url': '/tressamorrison/home/',
 'board_id': '119134421331766936',
 'pins': ['119134352618674646',
  '119134352618662252',
  '119134352618656367',
  '119134352618650870',
  '119134352618446617',
  '119134352618440692',
  '119134352618427540',
  '119134352618423757',
  '119134352618416078',
  '119134352613427201',
  '119134352613427199',
  '119134352613427192',
  '119134352613427188',
  '119134352613427166',
  '119134352613427161',
  '119134352613126372',
  '119134352612827413']}
반응형