sábado, 14 de noviembre de 2009

Convertir codigo HTML a caracteres ASCII españoles

En java puede utilizar este programa para convertir texto con caracteres españoles en código HTML hacia los caracteres conocidos de la escritura castellana.

public class Convertir {

 public static void main(String[] args) {

  String stringHTML = "A B<b>C</b><br />DE";
  String converted = convert(stringHTML);
  System.out.println(stringHTML);
  System.out.println(converted);
  System.out.println(converted.replaceAll("</?\\w++[^>]*+>", ""));
 }
 
 static String convert(String in) {
  return in.replace("&amp;","&")   
           .replace("&nbsp;"," ")   
           .replace("&lt;","<")   
           .replace("&gt;",">")   
           .replace("&ntilde;","ñ")   
           .replace("&Ntilde;","Ñ")   
           .replace("&aacute;","á")   
           .replace("&eacute;","é")   
           .replace("&iacute;","í")   
           .replace("&oacute;","ó")   
           .replace("&uacute;","ú")   
           .replace("&iquest;","¿")   
           .replace("&iexcl;","¡")   
           .replace("&quot;","\"")   
           .replace("&#039;","'");   
 }
}
El resultado de este programa es lo siguiente:

A&amp;nbsp;B&lt;b&gt;C&lt;/b&gt;&lt;br /&gt;DE 
A B<b>C</b><br />DE 
A BCDE 
Compartir:

0 comentarios:

Publicar un comentario