i-vector를 추출하기위해 kaldi 라이브러리를 사용하던중 ark파일에 접근하는 방법을 설명한다.

 

kaldiio 의 load_ark

설치 : pip install kaldiio

from kaldiio import load_ark

with open("~.ark") as fd:
    for key, numpy_array in load_ark(fd):
        print(key, numpy_array)

key에는 utt-id, numpy_array에는 array값이 추출되는것을 확인할 수 있다.


이 라이브러리를 알기전에 open()으로 인코딩 값을 설정하여 추출하였는데

f= open("~.ark","r",encoding="utf-8")
t = f.read()
f.close()

인코딩이 안되는 경우가 있었다.

 

참고 : https://www.wenyanet.com/opensource/ko/607aa478cab8002036617fe4.html

+ Recent posts