1. 이미지 추출
umplayer 사용
s 화면 캡처
1.1 캡처된 이미지 파일 애니매니션으로 병합.
-delay 옵션으로 화면 속도를 조정한다.
convert -delay 2 -loop 0 *.png animated.gif
1.2 영상 형식으로 병합
ffmpeg -framerate 1/2 -i shot%04d.png -c:v libx264 -r 30 out.mp4
-framerate 1/2: 프레임 속도를 1/2 FPS 또는 프레임 당 2 초로 설정
-i shot%04d.png: 파일이름 호출. shot0000.png ~ shot9999.png
-c:v libx264: libx264 비디오 코텍 사용.
-crf <number>: 품질 설정. 0 ~ 51
23 : 기본
0 : 무손실 인코딩이며 매우 높은 대역폭.
18 : 시각적 손실 확인 불가능.
-r 30: 출력 프레임 지정
out.mp4: 출력 파일 이름
1.2 캡처된 화면 나열 후 백그라운드 이미지 처리
tesseract-ocr
pdf 일때
convert -density 300 foo.png -depth 8 -strip -background white -alpha off out.tiff
원본 파일의 레이어가 문제인지 배경이 변경 안됨.
convert foo.png -transparent -background white -alpha off out.tiff
convert foo.png -transparent white -alpha off out.tiff
convert foo.png -background white -flatten -alpha off out.jpg
아래 명령으로 배경 처리.
gm convert -threshold 50% 'foo.png' 'out.tiff'
for i in *.png; do gm convert -threshold 50% "$i" "$i.tiff"; done
txt 파일 변경
tesseract out.tiff out
영문이 있을 경우
tesseract out.tiff -l eng text
for i in *.tiff; do tesseract "$i" -l eng "$i.text"; done
한글이 있을 경우
tesseract out.tiff -l kor text
2. 텍스트 번역
for i in *.txt ; do trans -e bing file://`pwd`/"$i" > "$i.ko.txt"; done
for i in *.txt ; do trans -e bing file://"`pwd`"/"$i" > "$i.ko.txt"; done
2.1 번역파일 병합
for i in *.ko.txt; do cat "$i" >> all_merge.txt; done
2.2 번역 파일 수정
2.3 text 파일 애니메니션 생성
txt 확장자를 gif 또는 png 변경
convert -delay 2 -loop 0 *.png animated.gif
2.4 text 파일 영상 형식 생성
txt 확장자를 gif 또는 png 변경
ffmpeg -framerate 1/2 -i shot%04d.png -c:v libx264 -r 30 out.mp4
3 음성 듣기
3.1 단어
simple_google_tts en Accessing
3.2 파일
simple_google_tts ko `pwd`/file.txt
4 음성녹음
4.1 단어 녹음
tts-cli "Hello" -l 'en' -o hello.mp3
4.2 파일 녹음
gtts-cli -f hello.txt -l 'en' -o hello.mp3
4.3 전체 텍스트 파일 mp3 만들기
for i in *.ko.txt ; do gtts-cli -f "$i" -l 'ko' -o "$i.ko.mp3" ; done && for en in *.txt ; do gtts-cli -f "$en" -l 'en' -o "$en.mp3" ; done
댓글 없음:
댓글 쓰기