Un carácter comodín ( comodín ) es un carácter que se utiliza para reemplazar otros caracteres o sus secuencias, lo que da lugar a patrones de caracteres . El desarrollo de los caracteres comodín son las expresiones regulares .
En la comunicación de datos, un comodín es un símbolo que se puede sustituir por cualquier conjunto predefinido de otros símbolos.
La mayoría de las veces se utilizan dos caracteres diferentes: para reemplazar cualquier cadena de caracteres y para reemplazar cualquier carácter individual. El primer carácter es casi siempre un asterisco ( * ). Sin embargo, también puede significar una cadena vacía (sin caracteres).
Los intérpretes de línea de comandos de varios sistemas operativos: COMMAND.COM en DOS , cmd.exe en Microsoft Windows , varios scripts de shell en *nix , usan comodines: un signo de interrogación ( ? ) como reemplazo de un solo carácter y un asterisco en el sentido anterior. Usándolos, puede operar (listar, borrar, copiar, etc.) inmediatamente con grupos de archivos. Ejemplos de comandos:
copiar *.txt > todo.txtcopia el contenido de todos los archivos de texto en el directorio actual en un solo archivo (DOS, Windows).
rm *.???elimina todos los archivos en el directorio actual cuya extensión consta de exactamente tres caracteres ( sh ).
En los programas de gestión de bases de datos, como SQL (en lugar de *, se utiliza el signo de porcentaje %, en lugar de ? , el guión bajo _) o Microsoft Access , más precisamente en sus lenguajes de scripting, se pueden utilizar caracteres comodín en las expresiones "LIKE":
SELECT * FROM books WHERE book_name LIKE '%хими%';
En expresiones regulares, el concepto de comodines se ha desarrollado aún más. Tienen notaciones especiales no solo para uno (".") y cualquier número ( el cuantificador "*" ) de caracteres, sino también para varias clases de caracteres (por ejemplo, caracteres vacíos "\s"), expresiones alternativas ( "|") y mucho más. otros. [1] Unicode usa caracteres combinados . Al igual que con las máquinas de escribir más antiguas , los caracteres básicos simples (espacios, puntuación, símbolos, números o letras) pueden ir seguidos de uno o más caracteres que no sean espacios en blanco (generalmente signos diacríticos , como acentos que cambian de letra) para crear un carácter imprimible específico ; Unicode también proporciona un conjunto limitado de caracteres precompuestos, es decir, caracteres que ya incluyen uno o más caracteres combinados. La secuencia del carácter base y los caracteres combinados deben coincidir con el mismo carácter único precompuesto (solo algunas de estas secuencias combinadas pueden precomponerse en un solo carácter Unicode, pero un número infinito de otras secuencias combinadas son posibles en Unicode y necesarias para varios idiomas.