행위

기계번역

조무위키

컴퓨터를 통해 한 언어를 다른 언어로 번역하는 일을 말함.

번역하기 제일 구린 단어[편집]

이 문서는 확고히 검증된 진실입니다.
이 문서는 거짓이 전혀 없는 완벽한 진실을 말하고 있습니다.
이 문서를 읽을 때는 안심하셔도 되니 편안한 자세로 보시기 바랍니다.

해외 개발자들이랑 우리 개발자들이랑 여럿 섞여서 번역 소프트웨어 작업하다가 문득 나온 이야기.

어느 나라 말이 가장 우수한지 이야기 했다면 결론이 나질 않을 것이므로, 반대로 어느 나라 말이 제일 구린지 이야기 함.

인도, 영국, 일본, 한국(나), 미국 출신의 다섯 개발자가 맥주와 과자를 먹으며 토론한 결과

가장 구린 언어는 일본어라는 결론이 나왔다. 이유는 3가지.

1) 하나의 언어를 배우려고 3종류의 문자를 배워야한다. 히라가나, 카타카나, 한자. 세상 어느 언어가 그러던가? 보통은 언어의 종류와 문자의 종류가 일치하기 마련인데, 일본어는 병신같이 히라가나 카타카나 한자 세가지 종류의 문자를 배워야한다.

2) 문자가 일상적인 발음을 모두 커버하지 못한다. 물론, 문자가 세상의 모든 소리를 다 표현할 순 없다. 하지만 적어도 일상적으로 자주 쓰이는 발음정도는 커버해야 한다. 일본어는 'ㅡ'발음이 없다. 'ㅡ'발음을 모두 'ㅗ'발음으로 대체했다. 병신 그자체다.

3) 동음이의어 한자 입력이 너무 성가시다. 우선 로마자로 발음을 입력한 다음, 선택지 중에서 자신이 찼는 한자를 선택해야한다. 이건 1번 이유와도 연관 있는데, 만약 하나의 문자로 처리되는 언어였다면 발음대로 입력하고 문맥상 판단하면 되지만 일본어는 무려 한자를 직접 사용하는 언어기때문에 일일이 찾아야한다.

(<- 일본 개발자가 한국은 한자를 직접 사용하지 않고 발음으로만 사용하니까 동음이의어 구분이 잘 안가서 사람들이 책을 안 읽는거라고 지랄하길래, 일본인들은 문맥상 판단이란걸 못할 정도로 병신이냐고 쏘아붙였더니 아가리 닥침)

그 다음으로 구린 언어는 중국어

서양인들은 하나의 글자가 하나의 의미를 담는다는 개념 자체를 못 받아들이더라

ㄴ ? 글자별로 1:1대응이 되면 기계입장에서 번역하기엔 오히려 편하지않냐? 사람입장에서 좆같은거지


상세[편집]

  • 규칙기반 기계번역

단어 사전과 번역 규칙을 이용한다. 즉 단어 하나하나를 독립적으로 번역한다.

야겜하다보면 팥고물 팥고물 이지랄하는 이유이다


  • 통계적 기계번역

원문과 해당 번역문에 대한 대량의 말뭉치 데이터를 활용한다.

알고리즘에 포함된 문장이 있으면 그걸 통째로 번역


  • 신경망 기계번역

AI번역이다. 사람이 번역하듯이 해주지만, 번역티가 나는 건 못지운다

결국엔 사람의 개입이 있어야 완벽한 번역이 나온다.