2011-12-25, 20:38
  #1
Medlem
bjornebarns avatar
Jag har ett väldigt störande problem. Jag försöker ladda ned japanska undertexter, som är sparade som .srt-filer och zippade, men eftersom jag inte har en japansk installation av windows, så gör nedladdningen av zip-filerna att .srt-filernas kodning ändras till ANSI, när de skall vara i UTF-8. Detta gör filerna totalt oläsbara.

Tidigare har jag haft tillgång till en dator med japanskt windows, och där kunde jag ladda ned filerna utan problem, och de var sparade i UTF-8 redan från början. Jag har testat att installera en helt japansk version av winrar, men det hjälpte inte. På datorn med japanskt windows hade jag en vanlig engelsk version av google chrome, så det är inte heller webläsaren det är fel på.

Det kanske mest lustiga är att om jag laddar ned en av zip-filerna till en icke-japansk windows, och sedan, utan att göra något med dem, för över dem till ett japanskt windows med ett USB-minne, och sedan öppnar filerna på den japanska datorn, så kommer filerna fortfarande att vara korrupta. Det är alltså själva nedladdandet av filerna till icke-japanskt windows som förstör dem.

Jag har testat att helt enkelt spara om filerna som UTF-8, men det gör ingenting.

Hur skall jag göra för att kunna ladda ned filerna? Tack så mycket för hjälp!
Citera
2011-12-25, 20:57
  #2
Medlem
xitunos avatar
Säker på att det är i utf8 och inte i utf16?

Har du en länk till någon av filerna?
Citera
2011-12-26, 11:52
  #3
Medlem
bjornebarns avatar
Nu har jag testat en massa olika saker och äntligen hittat hur jag kan göra. Här är en av filerna jag försökte med i går: http://subscene.com/japanese/Contagi...le-518092.aspx

Först laddar jag ned zip-filen, och extraherar text-filen. NU FÅR JAG INTE öppna filen, för även om jag öppnar den utan att spara, så förstörs kodningen. Och ja, det låter helt absurt, men så är det tydligen. Det jag måste göra är att byta namn på textfilen, så att det står .txt på slutet. Sedan väljer jag att öppna filen med webbläsaren, och ändrar kodningen i webbläsaren så att texten blir läsbar.

Sedan öppnar jag ett nytt dokument i google docs, dit jag kopierar in texten. Jag har försökt att direkt kopiera texten från webbläsaren in i notepad++, men då omvandlas allting till ANSI. Även om jag öppnar själva textfilen direkt i notpad++ så omvandlas allting till ANSI.

Hur som helst, när jag har kopierat in texten i google docs, väljer jag att spara allting som .rtf. Det går inte att spara som textfil, för då blir allting i ANSI. ALLA simpla textfiler, som .txt-filer, som jag laddar ned omvandlas direkt till ANSI av min dator. Men .rtf har dock alltid fungerat för mig tidigare (skolarbeten på japanska tex).

När jag har sparat google docs som .rtf-fil, öppnar jag den i word, samt öppnar en ny textfil med notepad. NU kan jag kopiera all text in till notepad, så det gör jag. Texten är nu i unicode, så jag sparar bara om det som UTF-8, och så är jag färdig!

Jag kan för övrigt tillägga att jag hade en kompis, med linux, som laddade ned filen, omvandlade till UTF-8 åt mig, och sedan laddade upp texten till Internet, så att jag både kunde ladda ned hans omvandlade originalfil, samt läsa texten som UTF-8 direkt i Internet. Även om jag kopierade den texten, eller laddade ned den filen, så omvandlades allting till ANSI.

Windows är ett riktigt d***-barn, men jag är mer d***.
Citera
2011-12-26, 13:19
  #4
Medlem
xitunos avatar
Problemet är att filerna du laddar ner INTE är i UTF-8.
Den filen du länkade till är kodad med Japanese Shift_JIS.

Och här kommer ditt problem: Engelska och Svenska versioner av Windows använder som default "ansi"-kodning vilket inte Japanska versioner gör.

Det du behöver göra är att koda om texten från Shift_JIS till UTF-8 (eller ställa in teckenkodningen i programmet som ska visa innehållet).

Jag gjorde så här:
  1. Ladda ner zip-filen
  2. Packa upp srt-filen och lägg den på skrivbordet.
  3. Öppna den i webbläsaren Firefox eller Chrome (MSIE tappar radbrytningarna)
  4. Ändra teckenkodningen till "Japanese Shift_JIS"
  5. Markera all text (CTRL-A), kopiera (CTRL-C)
  6. Öppna vanliga notepad
  7. Klistra in (CTRL-V)
  8. Välj "Spara som", sätt teckenkodningen till utf-8, namnge filen, klicka på Spara.

Om det är många filer du ska konvertera kanske du ska titta efter Iconv, eller be någon hacka ihop en websida som med hjälp av ett php-script gör omvandlingen.
Citera
2011-12-26, 13:25
  #5
Medlem
bjornebarns avatar
Citat:
Ursprungligen postat av xituno
Problemet är att filerna du laddar ner INTE är i UTF-8.
Den filen du länkade till är kodad med Japanese Shift_JIS.

Och här kommer ditt problem: Engelska och Svenska versioner av Windows använder som default "ansi"-kodning vilket inte Japanska versioner gör.

Det du behöver göra är att koda om texten från Shift_JIS till UTF-8 (eller ställa in teckenkodningen i programmet som ska visa innehållet).

Jag gjorde så här:
  1. Ladda ner zip-filen
  2. Packa upp srt-filen och lägg den på skrivbordet.
  3. Öppna den i webbläsaren Firefox eller Chrome (MSIE tappar radbrytningarna)
  4. Ändra teckenkodningen till "Japanese Shift_JIS"
  5. Markera all text (CTRL-A), kopiera (CTRL-C)
  6. Öppna vanliga notepad
  7. Klistra in (CTRL-V)
  8. Välj "Spara som", sätt teckenkodningen till utf-8, namnge filen, klicka på Spara.

Om det är många filer du ska konvertera kanske du ska titta efter Iconv, eller be någon hacka ihop en websida som med hjälp av ett php-script gör omvandlingen.

Jo, just den filen var tydligen i shift-JIS, men i alla fall, jag testade som du föreslog, men problemet är att när jag kopierar texten från webbläsaren, och försöker kopiera in i notepad, så ändras allting till ANSI direkt. Även när en kompis laddade upp en fil som han hade konverterat till UTF-8 åt mig, och jag kopierade den texten, så ändrades allting till ANSI av själva kopieringsproceduren.

Även om jag i notepad++ öppnar en ny fil, ställer in rätt kodning och sedan kopierar in texten från webbläsaren, så kommer det stå tex "ANSI as UTF-8" eller "ANSI as shift-JIS". Alltså omvandlas den kopierade strängen vid inklistringen till ANSI...

Jag vet inte varför det fungerar för dig, men för mig går det inte alls... (om jag inte tar steget via google-docs -> .rtf-fil -> word)

Jag får prova icon-v när jag får min riktiga dator tillbaka från lagningen (med linux installerat på)
__________________
Senast redigerad av bjornebarn 2011-12-26 kl. 13:30.
Citera
2011-12-26, 15:43
  #6
Medlem
xitunos avatar
Citat:
Ursprungligen postat av bjornebarn
Jo, just den filen var tydligen i shift-JIS, men i alla fall, jag testade som du föreslog, men problemet är att när jag kopierar texten från webbläsaren, och försöker kopiera in i notepad, så ändras allting till ANSI direkt.

Prova att använda helt vanliga notepad istället för notepad++.
Det var det jag gjorde här, och det fungerade utan problem.
Citera
2011-12-27, 14:34
  #7
Medlem
TorrentLovers avatar
Citat:
Ursprungligen postat av xituno
Prova att använda helt vanliga notepad istället för notepad++.
Det var det jag gjorde här, och det fungerade utan problem.
Det är inget fel med Notepad++, för mig funkade det utmärkt.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in