본문 바로가기

분류 전체보기209

파이썬 float 문자열 포맷팅 할 때마다 까먹어서..ㅠㅠ {:.2f}.format(num) 출처: https://medium.com/@coucoucamille/float-formatting-in-python-ccb023b86417 2023. 9. 13.
[코드트리챌린지] 늦었지만 09.05 ~ 09.11 공부 기록..! 목차 2023/09/05 실력 진단 결과 진단을 시행하였는데, 시뮬레이션 문제 풀이 속도가 느렸고, 개념과 문제 5개를 추천받아 풀이함. 1. 방향에 맞춰 이동 풀이 전략 - 동서남북에 대한 dx, dy를 미리 선언해준 뒤, 움직이려는 방향에 움직일 거리를 곱해 더해준다 코드트리 해설 참고 - 시간복잡도 O(n) - 공간복잡도 O(1) 풀이 코드 n = int(input()) moves = [] for _ in range(n): m,c = input().split() moves.append((m, int(c))) x, y = 0, 0 directions = {'W':0, 'S':1, 'N':2, 'E': 3} dx, dy = [-1, 0, 0, 1], [0, -1, 1, 0] # W S N E for m.. 2023. 9. 12.
pandas series fillna with another series 데이터프레임에 score라는 컬럼이 있을 때, score 컬럼의 nan 값을 옆에 있는 score2라는 컬럼의 값으로 대치하는 코드. df.score = np.where(df.score.isnull(), df.score2, df.score) 적용할 수 있는 상황과 목표는 아래 그림과 같이 나타낼 수 있다. (from stackoverflow) 답변도 위 이슈에서 얻을 수 있다. 2023. 9. 7.
conda 캐시 삭제 https://docs.conda.io/projects/conda/en/latest/commands/clean.html 안쓰는 가상환경이나 캐시를 삭제하는 명령어. conda clean --all 2023. 9. 7.
pandas 시리즈 binning 방법 (pd.cut) 원하는 bin의 개수를 bins로, bin의 정보를 labels 로 전달하면 데이터가 레이블링 되어 나온다! pd.cut(series, bins=3, labels=['bad', 'medium', 'good']) (출처: https://pandas.pydata.org/docs/reference/api/pandas.cut.html) 2023. 9. 7.
채팅 AI를 사용하여 한국어 텍스트 증강하기 (GPT-3.5, Bard, Clova X비교) 목차 배경 모바일 앱으로 쓰여진 한국어로 구성된 문장들을 여러 개 보유하고 있는데, 유사한 의미를 가지나 다르게 표현된 여러 개의 문장이 필요했다. 이렇게 기존 데이터로 유사한 데이터를 생성하는 것을 데이터 증강(augmentation)이라고 한다. 증강은 주로 비전 분야에서 많이 사용되었으나, 최근에는 거대 언어 모델이 발전함에 따라 자연어 분야에서도 필요로 한다고 한다. 영어는 우선 데이터도 많고, 연구가 많이 이루어졌으며, 단어의 구성이 비교적 단순하여 데이터 증강이 쉬운 편이지만, 한국어는 그렇지 않다. 알파벳을 나열하는 영어와 달리, 자음소의 조합이 하나의 음절을 이루고, 이 음절의 조합에 따라 단어가 구성되기 때문이다. 그래서 한국어 자연어 처리를 위한 라이브러리가 따로 있기도 하며, 일반적인.. 2023. 9. 5.