목록전체 글 (21)
Ramanu
import collections # d = not sorted dictionary, data = sorted dictionary / type = dict data = dict(collections.OrderedDict(sorted(d.items()))) collections 모듈을 사용하면 dictionary를 sort한 후 dictionary로 반환받을 수 있다.
... manager = multiprocessing.Manager() d = manager.dict() pool = multiprocessing.Pool(processes=n_process) pool.starmap(time_interval_log, zip(file_list, repeat(d))) pool.close() pool.join() with open("./test.p", "wb") as f: pickle.dump(d, f) 위와 같은 방식으로 multiprocess를 이용해 dictionary를 만들고 pickle로 저장하게 되면 load할 때 다음과 같은 error가 뜬다. -------------------------------------------------------------------..

Pandas의 내장함수 isin에 대한 정리 1. 기본 형태 [DataFrame1].isin([DataFrame2]) 의 형태로 구성된다. DataFrame1 안에 DataFrame2가 존재하는지 판단, result는 True, False 형태로 출력 2. 간단한 예시 - Data의 구성 예시 1) >>> data.isin(['A500']) 찾길 원하는 값 'A500' 만약 Data에서 True에 해당하는 값만 뽑아서 column을 보고 싶다면 다음과 같이 진행하면 된다. - isin 사용 >>> data[data.isin(['A500', 'A501'])['A']] # Data에서 Columns이 "A"인 곳에서 A500이 존재하는지 확인하는 코드이다. 예시 2) 찾길 원하는 값 : find_data(D..

python에 존재하는 모듈인 Pandas에서 데이터 분석을 위해 csv를 불러올 때 사용하는 함수이다. A. read_csv 1. 일반적인 작은 데이터를 불러 사용할 때 사용 import pandas as pd filename = './test.csv' data = pd.read_csv(filename) > Output 2-1. 대용량 데이터를 일부 처리할 때 사용 import pandas as pd filename = './test.csv' data = pd.read_csv(filename, skiprows=[i for i in range(1, 500)], nrows=100) skiprows : 1부터 10000까지 데이터를 건너뛴다. nrow : 20000개의 데이터를 불러온다. > Output #..