Get your ass now in UTF, boy

UTF-8 para mí se ha transformado en un movimiento como los estándares web, allá por el año 98. Estás solo, y apenas tres o cuatro personas que conoces lo implementan. Espero que dentro de 5 años todo el mundo lo use porque sí, aunque sea que lo terminen usando por moda. Que UTF se vea como algo bueno e imbatible, aunque realmente no tengan idea del por qué.

Hace poco Héctor puso UTF-8 en su weblog. La cosa ha cambiado bastante, la gente ahora escribe japonés en algunos comentarios y todo queda bien codificado. Parece que este pequeño cambio le ha agregado más valor del que nos imaginamos. Un valor que no se limita a las regiones hispanas sino que se abre a otras regiones.

No sé como explicarles lo bueno que es tener soporte UTF.

それを今変えなさい。それはよい。

¡Qué esperan para pasarse a UTF y olvidarse de todos los problemas de compatibilidades!

30 Respuestas a la entrada “Get your ass now in UTF, boy”

UTFっていいもんだぜ。
アッハン

[...] ¡Mira que es fácil! Ya lo sabía hace un tiempo, cuando canvié de servidor y tube que migrar las BBDD a UTF-8 por problemas de acentos y demás carácteres raros. Ahora despues de leer lo que dijo hace tiempo Minid y lo vuelve a decir ahora. Me he decidido después de documentarme, claro, a pasarme a UFT-8 私の名前 IVO です [...]

Efectivamente, mini-d.
A los cuadraditos esos que aparecen por problemas de incompatibilidades, los japoneses les llaman mojibake.

Escribí algo sobre esto en mi blog:
http://tochismochis.blogspot.com/2005/11/mi-nombre-en-japons.html

Para los archivos CompareBlogs utilizamos mayoritariamente UTF-8 pero en ocasiones nos daba fallos y para que funcionara tuvimos que utilizar “iso-8859-1″… Crees que es un error?

No se si te servira de consuelo o no pero en la comunidad Zopera el UTF-8 es muy utilizado porque, si no me equivoco, es la codificacion por defecto asi que, almenos en eso, los Zopers van a colaborar (la mayoria)

Saludos

Yo tuve unos problemas hace un tiempo con un proyecto al utilizarlo en los feeds y casi lo tiro por la borda.

Pero, es cierto si todo el mundo lo usase sería fantástico!

ya que estamos, vendría bien algunos tips de MySQL para migrar una base y todos sus campos de: varchar, text, blob a UTF-8 sin arruinar el contenido… ¿no les parece? si tengo tiempo investigo como hacerlo sin romper nada.

en mi caso esto significa un buen laburo de corrección pero el beneficio es posterior, actualmente también estoy en ISO salvo el Tag Board que lo tengo en UTF-8 para el laburo en AJAX pero me trajo problemas la conversión.

Espero que no traiga problemas con la config personal que tenga cada persona en su Browser, si bien uno aclara el UTF-8 en el encabezado, ¿todos los browsers lo toman?

Buenas, yo al principio me había decantado por el ISO-8859-15, luego ví un poco de UTF-8 que es el que viene por defecto para WordPresss, pero es que tengo un plugin para pasar a pdf que cada vez que lo usaba si tenía UTF-8 me hacía todo un estropicio, sin embargo funciona bien con la otra codificación. Intenté revisar el plugin pero me auto convencí por unos datos que me pasaron que tenía que poner una librería extra en el servidor y como no tengo ese nivel de acceso al servidor pues me quedé con el ISO. Saludos para todos!!!!!!!!!!

UTF no es complicado de aplicar.

1. En tu servidor web debes configurarlo para servir documentos UTF. En apache es pan comido.
2. Tus documentos deben estar creados con UTF si utilizarán algún tipo de caracter no iso. La gran mayoría de editores html soportan esto.
3. Tu base de datos debe soportar UTF.
4. En tu página debe tener indicadores UTF para que el navegador las interprete con la codificación correcta.

Cuesta un poco al principio, pero luego es pan comido.

Yo uso UTF-8, además de por sus virtudes, porque uso textpatern para mi site y se basa en UTF-8. Me está dando bastante guerra a la hora de publicar feeds de otros sites que no me llegan en UTF-8, de hecho he quitado mi sección de feeds hasta que lo solucione (estoy usando zfeeder para los feeds), pero por lo demás me encanta UTF-8. ¿Por qué usar otro juego de caracteres si este se lo como todo?

Si utilizas MySQL 4.1 o superior debes de añadir

mysql_query(”SET NAMES ‘utf8′”);

Después de conectarte a la BD.

Sino te puedes volver loco a mi me pasó Lo explico aquí

Como dice david, se puede hacer de esa forma o directamente en phpmyadmin hay una opción para exportar/codificar el contenido a otros formatos.

Como bien decian por ahi otro comentario con WP esta por defecto y sino sabes que es mejor dejarlo tal como esta pero es otra cosa mas que añadir a la lista para investigar sobre ello.

¡Soy feliz! Por tener todo rulando en UTF-8 y por salir mencionado así en minid.net. Pero temo el día en que te conozca y me digas: “¡Héctor/Kirai! Tu blog no valida, y el diseño empieza a apestar!”. Habrá que espabilar para que no pase ;)

No es tan fácil implementar UTF-8.

Pocos editores HTML lo soportan. PHP no lo soporta nativamente. Es complicado desarrollar herramientas de búsqueda. Los cuadraditos salen igual si tu S.O. no soporta el lenguaje que se te muestra (XP salido de la caja no soporta japonés, por lo menos el que instalan en mi empresa).

Pero sí, estoy de acuerdo contigo en que hay que desarrollar para la web pensando en que se ve en todo el mundo, y en todo el mundo se hablan muchos idiomas y hay que soportarlos.

Mucho se habla de accesibilidad, que si los ciegos, que si los navegadores solo texto, que si las PDA’s, … etc.

Pero si quieres que tu web sea accesible por la mayor cantidad de gente posible tienes que publicarla en varios idiomas. De que vale que mi web la pueda leer un ciego si no entiende español.

Pensadlo: Si mi web esta hecha pensando en que sea interpretable por un lector de webs puede que la puedan entender 0,01% de personas más. Si la pongo en inglés duplico la cantidad de gente que puede entenderla. ¿Qué es más accesible?

Imaginaos por donde deben de ir los esfuerzos de una empresa.

No obstante, una cosa no quita la otra.

¿Y como se pasa de “iso-8859-1 a UTF8? Evidentemente hablando de un blog (wordpress)

Debo decir que no tengo claro las limitaciones del UTF en PHP. Sí te puedo decir que no hay problemas para implementarlo lleva entre 5-10 minutos todo.

Diego, yo tuve problemas implementando en una ocasión, pero cometés un error al sugerir cambiar algo de Apache… el 99% de los hostings NO TE DA acceso al apache!! y no tengo un server propio en mi casa.

Obviamente prefiero pasar a UTF-8, pero el paso es lento, no fácil, ni nada por el estilo, ya tuve problemas en una oportunidad con esto y terminé rompiendo casi todos los caracteres de tildes y eñes, no way! :p eso me va a llevar mucho laburo, más que quien programa mi CMS soy yo y carezco de tiempo!

Yo tengo un blog con wordpress 1.5, así como recién salido de la caja (ni el tema le cambié) y por lo que veo está en UTF-8.
En el blog se ve todo muy bien, pero ahora me percato que un trackback a otro sitio me sale todo destruído.
Es un problema mío o un problema del otro sitio?
Este es el enlace en cuestión:
http://www.zonaindie.com.ar/index.php/operacion-teddy/
Muy interesante, ya que estamos ;-)

Convertir datos de ISO8859-1 a UTF-8 en MySQL:
http://www.ymipollo.com/~ToRo/41831.ymipollo-com-con-utf-8.html

Aún me faltan algunos archivos, hay la llevo. Saludos ;-)

UTF = Uat The F..k?

No me pude contener.

すごい!:D

Hola,

te sigo desde hace tiempo (aunque en la sombra) desde que con Kusor y Meddle intentamos crear una comunidad abierta sobre js con un standard común (gen7es).
Se que el primero en retirarme fui yo, pero el trabajo es el que manda y nos da de comer.

Me marche porque tenía quer cambiar la residencia de mi ciudad de origen a Madrid para trabajar para el “gobierno”, con esto quiero decir que no soy funcionario pero estoy metido en todos los “fregaos” sea quien sea el que mande.

Bueno, despues de esta intro (que sirva de disculpa a mis antiguos compañeros, espero –lo siento no puedo hacer nada más por temas de contrato–), quiero decir que se están migrando todas codificaciones del estado a UTF-8, simplemente porque su migración es mas o menos sencilla y arroja muchas ventajas, sobre todo en el tema de intercambio de información entre paises.

Actualmente estamos trabajando con China y Japón. Inicialmente creíamos que con UTF-8 tendríamos problemas de “encoding” y necesitaríamos usar UTF-16, pero lo cierto es que con UTF-8 vamos de maravilla.

Con esto no quiero decir que sea la panacea y que estemos salvados de todos los males heredados del famoso ASCII/ANSI, pero si ayuda mucho.

Salu2 a Kusor, Sergi y Maelmori.

Uso Opera 8.5 y cuando miro el blog de Kirai no veo los kanji. Se reemplazan por cuadraditos…
Siempre pensé que Kirai no usaba utf8, pero ahora que decís que si, me parece raro… A alguien mas le pasa esto ?

salu2

Supongo que será porque no tienes una fuente (tipografía) que soporte los caracteres japoneses.

Prueba a instalar la Arial Unicode MS en tu sistema.

Hombre, eso no deberia ni ser cuestionable, UTF-8 por defecto; pero claro, no todos los servicios de blogs lo soportan :(

[...] En la era donde cada vez hay más aficionados a la cultura japonesa se hace, para muchos, indispensable la posibilidad de ver carácteres orientales en su navegador. Como bien explica minid en su entrada Get your ass now in UTF, boy la codificación UTF-8 nos hace la vida mucho más fácil (estoy pensando cambiar este blog a UTF-8 en un futuro) en este tema. [...]

Una duda, tengo una web hecha con flash que carga todos los contenidos desde Mysql a traves de PHP. Necesito hacer la web en varios idiomas (chino, japones, ruso, etc..) y no se si puedo utilizar la misma base de datos para todos estos idiomas, y tampoco se si el flash me leerá bien todos los caracteres, alguien sabe algo de esto?

[...] La verdad es que no tenía ninguna necesidad imperiosa de pasar la página utf-8 [ salvo la de dejar de oír a los colegas dando la lata ]. Así que he terminado por reconocer que puede entrar un japonés y ponerme un comentario en su lengua materna. [...]

Escrito por Ranuke
Marzo 17th, 2006 at 9:23 pm

Hola,

Tengo un pagina web en dos varios idiomas, entre ellos español y japones hecha con html y php.
El problema es que tengo dos formualarios que se envian por correo y ni veo bien los acentos y las ñ ni los simbolos japoneses.
Creo que la solucion es usar UTF pero no se como lo tengo que hacer.
Me podeis ayudar?