Foro de elhacker.net

Programación => Desarrollo Web => Mensaje iniciado por: Aikanáro Anário en 30 Junio 2011, 07:22 am



Título: Preguntas con respecto a la codificación de caracteres.
Publicado por: Aikanáro Anário en 30 Junio 2011, 07:22 am
¿Por qué hay tantos estándares para la codificación de caracteres? ¿No se supone que el Unicode (creo que es lo mismo que UTF) es el universal y soporta todos los idiomas?

Estaba haciendo unas pruebas cambiando la codificación de caracteres del navegador y entrando a algunas páginas, pero nada cambió, los caracteres que deberían de cambiar por "garabatos" (tildes, eñes, etc.) no cambiaron, todo se quedo igual, en cambio, si yo hago un documento html y lo guardo con una codificación distinta a la del navegador sí salían todo cambiado. ¿Tiene algo que ver con las etiquetas xml:lang? Entonces si esas etiquetas resuelven todo el problema ¿para qué se complican tanto con tatas codificaciones diferentes, me pregunto otra vez?

¿Qué es lo recomendable para crear una página o documento html: usar las entidades html o una codificación o qué? Porque usar las entidades es tedioso.


Título: Re: Preguntas con respecto a la codificación de caracteres.
Publicado por: Nakp en 30 Junio 2011, 08:06 am
no es tedioso en lo absoluto... solo pasas tu output por htmlentities

resulta que el juego de caracteres es para decirle al navegador que caracteres tener listos para mostrar tu web, asi no tiene que cargar los miles que existen, ya que en español existen unos, en ingles existen menos, y en japones muchos mas, basicamente definen el juego de caracteres que se utilizan en el idioma que esta el contenido, utf-8 es universal (y por lo tanto mas pesado)

puedes encontrar algo mas de informacion buscando que juego de caracteres usar en las bases de datos, donde se debe optimizar dependiendo del contenido


Título: Re: Preguntas con respecto a la codificación de caracteres.
Publicado por: Aikanáro Anário en 30 Junio 2011, 18:21 pm
Ok, entiendo por qué hay tantos, pero aun así no me aclaro con lo que pasa cuando entro a una página, por ejemplo de china, y teniendo la codificación iso 8859-1 o de europa occidental, igualmente puedo ver también los caracteres chinos. Se supone que si tengo esa codificación (que es para los caracteres del latín) no debería de ver correctamente los caracteres chinos.

En ninguna página que entre parece afectar la codificación que elija en el navegador, pero cuando yo mismo creo un documento html y lo guardo con una codificación diferente a la del navegador entonces sí afecta y los caracteres acentuados y especiales aparecen como símbolos raros. Y eso me pasa aún cuando elijo la codificación utf-8 que es la universal.

Según leí htmlentities es una función de php, no sé php, a penas estoy aprendiendo html.