카테고리

asm (27) bootloader_x86_grub (1) C (92) compile (11) config (76) CPP (13) CSS (1) debugging (7) gimp (1) Go (1) html (1) Java (1) JavaScript (1) kernel (19) LibreOffice (3) Linux system progamming (21) MFC (1) opencv (4) OpenGL (1) PHP (1) Python (4) qemu (29) shell (3) socket (7) troubleshooting (2) ubuntu18.04 (2) windows (1)

2018/12/29

화면 캡처후 이미지 text 처리

1. 이미지 추출
umplayer 사용
s 화면 캡처

1.1 캡처된 이미지 파일 애니매니션으로 병합.
-delay 옵션으로 화면 속도를 조정한다.

convert -delay 2 -loop 0 *.png animated.gif

1.2 영상 형식으로 병합
ffmpeg -framerate 1/2 -i shot%04d.png -c:v libx264 -r 30 out.mp4

-framerate 1/2: 프레임 속도를 1/2 FPS 또는 프레임 당 2 초로 설정
-i shot%04d.png: 파일이름 호출. shot0000.png ~ shot9999.png
-c:v libx264: libx264 비디오 코텍 사용.
              -crf <number>: 품질 설정. 0 ~ 51
                                                                 23 : 기본
                                                                   0 : 무손실 인코딩이며 매우 높은 대역폭.
                                                                 18 : 시각적 손실 확인 불가능.
-r 30: 출력 프레임 지정
out.mp4: 출력 파일 이름

1.2 캡처된 화면 나열 후 백그라운드 이미지 처리
tesseract-ocr
pdf 일때
 convert -density 300 foo.png -depth 8 -strip -background white -alpha off out.tiff

원본 파일의 레이어가 문제인지 배경이 변경 안됨.
 convert foo.png -transparent -background white -alpha off out.tiff
 convert foo.png -transparent white -alpha off out.tiff
 convert foo.png -background white -flatten -alpha off out.jpg

아래 명령으로 배경 처리.
 gm convert -threshold 50% 'foo.png' 'out.tiff'
 for i in *.png; do gm convert -threshold 50% "$i" "$i.tiff"; done

txt 파일 변경
 tesseract out.tiff out

영문이 있을 경우
 tesseract out.tiff -l eng text
 for i in *.tiff; do tesseract "$i" -l eng "$i.text"; done

한글이 있을 경우
 tesseract out.tiff -l kor text

2. 텍스트 번역
 for i in *.txt ; do trans -e bing file://`pwd`/"$i" > "$i.ko.txt"; done
 for i in *.txt ; do trans -e bing file://"`pwd`"/"$i" > "$i.ko.txt"; done

2.1 번역파일 병합
for i in *.ko.txt; do cat "$i" >> all_merge.txt; done

2.2 번역 파일 수정
2.3 text 파일 애니메니션 생성
txt 확장자를 gif 또는 png 변경
convert -delay 2 -loop 0 *.png animated.gif

2.4 text 파일 영상 형식 생성
txt 확장자를 gif 또는 png 변경
ffmpeg -framerate 1/2 -i shot%04d.png -c:v libx264 -r 30 out.mp4

3 음성 듣기

3.1 단어
 simple_google_tts en Accessing

3.2 파일
 simple_google_tts ko `pwd`/file.txt

4 음성녹음
4.1 단어 녹음
 tts-cli "Hello" -l 'en' -o hello.mp3

4.2 파일 녹음
  gtts-cli -f hello.txt -l 'en' -o hello.mp3

4.3 전체 텍스트 파일 mp3 만들기
for i in *.ko.txt ; do gtts-cli -f "$i" -l 'ko' -o  "$i.ko.mp3" ; done && for en in *.txt ; do gtts-cli -f "$en" -l 'en' -o  "$en.mp3" ; done

댓글 없음:

댓글 쓰기