UTF-8 es una codificación de caracteres que describe cada punto de código Unicode utilizando una secuencia de bytes de uno a cuatro bytes. Es compatible con versiones anteriores de ASCII y, al mismo tiempo, admite la representación de todos los puntos de código Unicode.

utf-8...

Estoy tratando de decodificar una cadena hexadecimal en Python. value = "" for i in "54 C3 BC 72 20 6F 66 66 65 6E 20 4B 6C 69 6D 61".split(" "): value += chr(int(i, 16)) print(value) Resultado: Tür offen Klima El resultado esperado debería ser "Tür offen Klima". ¿Cómo puedo hacer que esto funcio....
10 ago. 2020 a las 10:51
Estoy tratando de filtrar las aplicaciones que no están en inglés de un conjunto de datos para un problema en el que estoy trabajando. ¿Cómo se pueden eliminar del conjunto de datos las aplicaciones que no están en inglés? Un enfoque inicial será verificar si la cadena se puede codificar solo con ca....
9 ago. 2020 a las 02:13
Tengo algunos nombres de productos que incluyen caracteres Unicode. ⚠️📷¡POR FAVOR LEA! CÁMARA DIGITAL KODAK DC215 CON ZOOM 1.0MP DE FUNCIONAMIENTO - VENDEDOR DEL REINO UNIDO Una consulta en heidiSQL lo muestra bien Configuré MariaDB nuevo esta mañana después de haberme movido de MySQL, pero cuando ....
3 ago. 2020 a las 19:25
¿Hay alguna manera de convertir una \x cadena de escape como "\\xe8\\xaa\\x9e\\xe8\\xa8\\x80" en un formato legible: "語言"? >>> a = "\\xe8\\xaa\\x9e\\xe8\\xa8\\x80" >>> print(a) \xe8\xaa\x9e\xe8\xa8\x80 Soy consciente de que hay una pregunta similar aquí, pero parece la solución es solo para caracte....
2 ago. 2020 a las 20:18
Estoy trabajando en un proyecto donde uso php para tomar una palabra griega aleatoria de un xampp sql server. Luego uso str_shuffle() para aleatorizar el orden de las palabras (ex. bye => ybe). Sin embargo, usar str_shuffle() en letras griegas devuelve la palabra con muchos ???? en lugar de la mayor....
30 jul. 2020 a las 11:21
Tengo un caso en el que tengo que cambiar los conectores Oracle de 11g a 12c y la consulta siguiente ya no funciona: seleccione getunicodetransl (columna) de la tabla . En 11g funcionó sin error, pero en la versión 12c da el error "ORA-00904:" GETUNICODETRANSL ": identificador no válido". ¿Cómo pue....
29 jul. 2020 a las 12:56
Quiero decodificar la respuesta de la solicitud http. Pero obteniendo un error al codificar a .utf8 String(data: data, encoding: .utf8) devuelve nil cuando los datos contienen diéresis del idioma alemán (Ü Ö Ä ü ö ä è é) ¿Cómo puedo decodificar el objeto Data? correctamente? Editar: proporcionar más....
21 jul. 2020 a las 15:10
Por alguna razón, no puedo crear el employeeTable en la base de datos sample al abrir el SamplePage.php en mi navegador Chrome desde el siguiente enlace: http://ec2-13-57-28-240.us-west-1.compute.amazonaws.com/SamplePage.php Pude crear mi instancia EC2 desde AWS Crear una instancia EC2 e instalar u....
19 jul. 2020 a las 19:51
Estoy tratando de leer las credenciales de usuario del archivo de texto. En la contraseña, hay un carácter 'ü'. Cuando leo de txt. Imprime el carácter 'l'. UTF8 no funciona para caracteres turcos. Como puedo leer def get_username_password(): dosya = open("D:\\user.txt","r",encoding="utf8",errors....
9 jul. 2020 a las 09:58
Hola, tengo que convertir una columna de cadena en su versión en mayúscula, pero cuando 'ß' está presente en la cadena, se cambia a 'SS' mientras lo hago en mayúscula. Entiendo que esto se debe a que, antes, 'SS' se consideraba en mayúscula. 'ß'. PERO en 2017, se permiten tanto 'SS' como mayúsculas ....
7 jul. 2020 a las 09:11
Ya sé si quiero codificar y decodificar una cadena en 'utf-8', puedo hacer ... string = "Kröger" print(string.encode('utf-8')) >> b'Kr\xc3\xb6ger' print(b'Kr\xc3\xb6ger'.decode('utf-8') >> Kröger Si tengo una cadena 'Kr\xc3\xb6ger' sin especificar que era de <class bytes> (falta el prefijo 'b'), ....
5 jul. 2020 a las 22:57
No puedo leer correctamente los datos de Excel con caracteres acentuados con pandas. data = pd.read_excel("C:/Users/XXX/Desktop/Help_me_plz.xlsx", encoding='utf-8') Esto lo obtengo: ID Titre Entité 0 2020044459 SOAPPRO - Problème ouverture documents Root entity > Utilisateurs 1 202004....
2 jul. 2020 a las 18:29
https://github.com/google/codesearch/blob/master/index/write.go#L581 Veo lo anterior para probar si dos bytes pueden aparecer en una cadena UTF8 válida. Pero no entiendo cómo funciona. ¿Alguien podría ayudarme a entender por qué funciona esta función? Gracias.....
13 jun. 2020 a las 07:24
Tengo este texto Grou00dfbeerenstrau00dfe y necesito convertirlo a Großbeerenstraße también Eichstu00e4tt a Eichstätt Pero no entiendo y resuelvo esto completamente por estas razones: SOLO se convierten algunos caracteres (caracteres especiales), no todo el texto Los textos Unicode generalmente tien....
10 jun. 2020 a las 19:57
Digamos que tengo el emoji 😈 (diablo). En UTF-8 de 4 bytes, se representa así: \u00f0\u009f\u0098\u0088 Sin embargo, en Java, solo se imprimirá correctamente así: \ud83d\ude08 ¿Cómo convertiría del primero al segundo? ACTUALIZACIÓN 2 La respuesta de MNEMO es mucho más simple y responde a mi pregun....
1 jun. 2020 a las 07:17
Trabajo en una aplicación C ++ e implementé una clase de traductor que usa datos de un archivo XML para traducir cadenas. Ahora tengo serios problemas con los caracteres especiales para los Umlauts alemanes ÖÄÜ, por ejemplo ... En Visual Studio, veo lo siguiente en la vista de depuración, lee la sig....
31 may. 2020 a las 09:27
Estoy enfrentando el problema al convertir la codificación / decodificación de los datos con C #. He codificado ciertos datos de base64 (codificados) y ha decodificado con éxito la cadena. Como a continuación, string encodedText = "eyJDb25uX0dyb3VwX0lEIjozMywiVXNlckVtYWlsIjoiVGVzdHNlcnZpc2VA\nZ21haW....
29 may. 2020 a las 20:19
Tengo una expresión como esta que produce la lista de bytes de la representación utf-8. list(chr(number).encode("utf-8")) Pero, ¿cómo hacer esto a la inversa? Digamos que tengo 2 bytes [292, 200] como lista, ¿cómo puedo decodificarlos en un símbolo?....
9 may. 2020 a las 14:28
Las únicas circunstancias especiales son: se ejecuta en una frambuesa pi, se ejecuta en Linux, el archivo contiene letras especiales como äöü (sí, lo hice #!/usr/bin/env/python # -*- coding:utf-8 -*- En cada archivo)....
8 may. 2020 a las 10:27
Estoy revisando el código de prueba jdk para ver cómo validan su UTF8.encode () funciona como se esperaba, ya que tenemos casos similares. Algunos casos de prueba que no entiendo completamente por qué no son válidos. (byte) 0xC0, (byte) 0x80}, // primer byte no válido https://github.com/frohoff/jdk8....
1 may. 2020 a las 00:44
Aquí tengo un código simple: #include <iostream> #include <cstdint> int main() { const unsigned char utf8_string[] = u8"\xA0"; std::cout << std::hex << "Size: " << sizeof(utf8_string) << std::endl; for (int i=0; i < sizeof(utf8_string); i++) { std::co....
29 abr. 2020 a las 18:44
Intento decodificar esta variable muy simple b'autorite nt\\syst\x8ame\r\n' b'autorite nt\\syst\x8ame\r\n' >>> t.decode('utf-8') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8a in position 16: invalid start byte Pero ....
27 abr. 2020 a las 18:57
Para consulta: SHOW VARIABLES LIKE 'char%'; La base de datos MySQL devuelve: character_set_client latin1 character_set_connection latin1 character_set_database latin1 character_set_filesystem binary character_set_results latin1 character_set_server latin1 character_set_system utf8....
10 abr. 2020 a las 05:58
¿Cómo puedo limpiar mis entradas de formulario para caracteres como emojis? Por ejemplo, cuando publico un párrafo en un área de texto con un emoji como este 😊, no se inserta un Registro en la base de datos. No puedo cambiar mi tabla de base de datos a utf8mb. Es utf8 en este momento. He intentado l....
2 abr. 2020 a las 22:25
Estoy probando la interfaz Perl de Bryan Henderson con la biblioteca ncurses: Curses Para un ejercicio simple, trato de obtener caracteres individuales escritos en pantalla. Esto se basa directamente en el HOWTO de programación de NCURSES, con adaptaciones . Cuando llamo a getchar() de la biblioteca....
28 mar. 2020 a las 18:43