Code-switching Sentence Generation

by Generative Adversarial Networks and its Application to Data Augmentation



Code-switching (CS) generation


Bad SS examples generated by our proposed model

Generation: 可是 這 zhang 有沒有 看到 呢 完全沒有
Origin: 可是 這 張 有沒有 看到 呢 完全沒有
    (But did you see this one? Nothing at all)
Description

"張" is an unit of paper which should be translated into "sheet" or replaced "這 張" by "this one" in English in this sentence.

Generation: So we people 的 耳朵 跟 眼睛
Origin: 所以呢 我們 人 的 耳朵 跟 眼睛
    (So our/people's ears and eyes)
Description

"we" and "people " may appear simultaneously in Chinese but not in English.

Generation: 那 這個 現象 當然 你 也可以 從 另外 一個 觀點 來 miss
Origin: 那 這個 現象 當然 你 也可以 從 另外 一個 觀點 來 想
    (Of course, you can think of it from another point of view)
Description

"想" means "think" instead of "miss" in this sentence.

Generation: To 上 長 長 到 無限大 的時候 呢 會變成 九十度
Origin: 向 上 長 長 到 無限大 的時候 呢 會變成 九十度
    (It grows up and when it grows up to infinity, it will become ninety degrees)
Description

It seems not a reasonable code-switching sentence which may be frequently said by people. Maybe code-switching "向 上 長" to "grow up" will be more reasonable.

Generation: 你可以 a circle 一圈 的 切出 來 每 一圈 都 得到 一個
Origin: 你可以 一圈 一圈 的 切出 來 每 一圈 都 得到 一個
    (You can cut it out in a circle and get one every turn)
Description

"一圈 一圈" may code-switch simultaneously.

Generation: 因為 我們 收斂 不 收斂 就是 看這個 收斂 不 convergence
Origin: 因為 我們 收斂 不 收斂 就是 看這個 收斂 不 收斂
    (Because whether it converges or not depends on whether this converges or not)
Description

"收斂 不 收斂" or "converge 不 converge" or "converge or not" seems more reasonable.

Generation: That these 在 你 在 別的 課 都 已經 學過 了
Origin: 那 這些呢 在 你 在 別的 課 都 已經 學過 了
    (Well, these are what you have already learned in other classes)
Description

"那" in this sentence is a filled pause and it should be translated into "well."




Code-switching (CS) generation

Bad SS examples generated by our proposed (+pos) model

Generation: 因為 呢 他 會 變得 比較 難以想像 MEETING 是什麼 狀況
Origin: 因為 呢 他 會 變得 比較 難以想像 會 是什麼 狀況
    (Because he (it) will become more difficult to imagine what it will be)
Description

"會" in this sentence means "將會 (will be)" instead of "會議 (meeting)."

Generation: 因為 我們 要 看 HE 收 不 收斂
Origin: 因為 我們 要 看 他 收 不 收斂
    (Because we will see whether he (it) converges)
Description

We seldom code-switch pronouns like it, she, he.

Generation: 那 可是 你 只要 像 外 一 移動 呢 他 WILL BE 變得 很大
Origin: 那 可是 你 只要 像 外 一 移動 呢 他 就會 變得 很大
    (Well, but once you move out, he (it) will become very big)
Description

We usually code-switch auxiliary verbs "將會 (will)" along with verbs "變得 (become)" together.

Generation: 然後 離開 之後 就 MORE AND MORE 大 等等 那 同樣 道理 呢 如果 它 離 越 遠 的話 呢
Origin: 然後 離開 之後 就 越來越 大 等等 那 同樣 道理 呢 如果 它 離 越 遠 的話 呢
    (Then, after leaving, it is getting bigger and bigger, etc. The same reason, if it is farther away, then ...)
Description

It's better to code-switch "越來越 (more and more)" and "大 (big)" together to "bigger and bigger".




[top]