i-vector를 추출하기위해 kaldi 라이브러리를 사용하던중 ark파일에 접근하는 방법을 설명한다.
kaldiio 의 load_ark
설치 : pip install kaldiio
from kaldiio import load_ark
with open("~.ark") as fd:
for key, numpy_array in load_ark(fd):
print(key, numpy_array)
key에는 utt-id, numpy_array에는 array값이 추출되는것을 확인할 수 있다.
이 라이브러리를 알기전에 open()으로 인코딩 값을 설정하여 추출하였는데
f= open("~.ark","r",encoding="utf-8")
t = f.read()
f.close()
인코딩이 안되는 경우가 있었다.
참고 : https://www.wenyanet.com/opensource/ko/607aa478cab8002036617fe4.html
'개발공부 > Python' 카테고리의 다른 글
Python :: DataFrame 출력 개수 조정 (0) | 2022.01.20 |
---|---|
Python :: 정규식 (0) | 2022.01.18 |
Python :: 유용한 기능 | 함수 파라미터 설명 (0) | 2022.01.14 |
Python :: 유용한 기능 tqdm, 진행 상황 (0) | 2022.01.14 |
Python :: 파일 복사, 이동, 삭제, 파일 명 변경(rename) (0) | 2022.01.14 |