Nije u pitanju VirtueMart ali bilo bi vrlo, vrlo slično.
Ovo bi pripadalo u obavezno, al' ok.
Nije sve tako jednostavno, kako se čini...Hrvatski,Engleski,Njemački
Table UTF-8 Unicode Character Set - for HTML UTF-8 enabled pages.
Tony Franks -
www.tony-franks.co.uk, čovjek si je dao truda i lijepo to prikazao.
Srećom netrebam neki arapski..
Često sam nailazio na pitanja po forumima u vezi problema naših znakova (čćžšđ). Obično sam prelazio preko takvih pitanja promatrajući to sa gledišta - radi se o početnicima, kad malo više pročitaju o tome rješit će svoj problem.
Zahtjev korisnika
- Web trgovina, uvoz postoječih podataka ( sa računala koja rade lokalno ), transfer podataka iz web trgovine u web trgovinu koja ima podatke iz nekoliko web trgovina.
Ok, nije to tako problematično, bar ne na prvi pogled, imamo unicod UTF-8 i to bi trebalo biti rješenje.
Postavim web trgovinu, UTF-8, Engleski, Njemački, Hrvatski i sve to lijepo funkcionira.
- Nakon uvoza podataka nastaju problemi, koji je karakter set uvezenih podataka ?
- kako analizirati nešto kad vidimo dobro poznate kukice u bazi putem PHPMyAdmina ne vidim hrvatske znakove
Da vidimo što je to sa php MyAdmin, njihov sustav koristi ISO-8859-1 charset. Iz tog se razloga hrvatski znakovi ne ispisuju dobro što neznači da se neće dobro interpretirati kad ih podignemu kroz neki listing.
Pravo raspoloženje dolazi kad to pokušate sortirati abecednim redom, naravno tako da funkcionira u prisutnim jezicima?
Ako je netko koristio Php naredbu UCFIRST kako nebi trebao voditi računa o prvom velikom slovu, Php naredba UCFIRST ne radi korektno.
Prekopao sam pola net-a kako bi našao neko rješenje ali ništa od toga, problem sa uvozom podataka koji nisu u UTF-8 enkodingu je prilično složena stvar. Da li je netko rješavao sličan problem.
prebačeno sa eurofreecode, a evo i jazzmanovog odgovora
Ja se unicodom bavim 10-tak godina... Naročito u zadnje vreme (Elxis). Ovo o čemu si pričao ima veze sa PHP-om, koji ne prosleđuje karaktere, nego bajtove. Kod "naših" slova, potrebna su dva bajta za opis karaktera (kod složenijih jezika, čak tri!). Sve dok ne izađeš iz iso-8859-1 (latin1), nema problema. Zato, recimo Elxis ima zasebnu klasu utf8.class.php. Sve komande za baratanje stringovima idu preko ove klase. Npr. strlen() će biti eUTF8::strlen(). Malko je preopširna tema za forum.
- I za kraj, nisam proučio ovu klasu, kad analiziram.....