Polimorfismo paramétrico

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 12 de abril de 2021; las comprobaciones requieren 5 ediciones .

El polimorfismo paramétrico en lenguajes de programación y teoría de tipos  es una propiedad de la semántica de un sistema de tipos que permite procesar valores de diferentes tipos de forma idéntica, es decir, ejecutar físicamente el mismo código para datos de diferentes tipos. [1] [2] .

El polimorfismo paramétrico se considera la forma "verdadera" de polimorfismo [3] , lo que hace que el lenguaje sea más expresivo y aumente en gran medida la reutilización del código . Tradicionalmente, se opone al polimorfismo ad-hoc [1] , que proporciona una interfaz única para código potencialmente diferente para diferentes tipos permitidos en un contexto dado, potencialmente incompatible ( estática o dinámicamente ). En varios cálculos, como la teoría de tipos calificados , el polimorfismo ad-hoc se trata como un caso especial de polimorfismo paramétrico.

El polimorfismo paramétrico subyace a los sistemas de tipos de lenguajes en la familia ML ; estos tipos de sistemas se denominan polimórficos. En las comunidades de lenguas con sistemas de tipos no polimórficos (descendientes de Algol y BCPL [4] ), las funciones y tipos paramétricamente polimórficos se denominan " generalizados ".

Tipo de polimorfismo

El término " polimorfismo paramétrico " se usa tradicionalmente para referirse al polimorfismo paramétrico de tipo seguro , aunque también existen formas sin tipo (ver polimorfismo paramétrico en C y C++ ) [4] . El concepto clave del polimorfismo paramétrico con seguridad de tipos, además de la función polimórfica , es el tipo polimórfico .

Un tipo polimórfico ( eng.  polymorphic type ), o un politipo ( eng.  polytype ) es un tipo parametrizado por otro tipo. Un parámetro en la capa de tipo se denomina variable de tipo (o variable de tipo) .

Formalmente , el polimorfismo de tipos se estudia en el cálculo lambda tipado polimórficamente , llamado Sistema F.

Por ejemplo, se puede construir una función que appendconcatene dos listas en una sin importar el tipo de elementos de la lista. Deje que la variable de tipo a describa el tipo de los elementos de la lista. Entonces la función appendse puede escribir como " forall a. [a] × [a] -> [a]" (aquí la construcción [a]significa el tipo " una lista, cada elemento de la cual tiene un tipoa " - la sintaxis adoptada en el lenguaje Haskell ). En este caso, se dice que el tipo está parametrizado por una variable apara todos los valores a. En cada lugar de aplicación appenda argumentos específicos, ase resuelve el valor, y cada mención del mismo en la signatura tipo se reemplaza por un valor correspondiente al contexto de aplicación. Por lo tanto, en este caso, la firma del tipo de función requiere que los tipos de elementos de ambas listas y el resultado sean idénticos .

El conjunto de valores válidos para una variable de tipo viene dado por cuantificación . Los cuantificadores más simples son universales (como en el ejemplo con append) y existenciales (ver más abajo).

Un tipo calificado es un  tipo polimórfico, adicionalmente equipado con un conjunto de predicados que regulan el rango de valores válidos para un parámetro de este tipo. En otras palabras, la calificación de tipo le permite controlar la cuantificación de forma arbitraria. La teoría de los tipos calificados fue construida por Mark P. Jones en 1992 [5] . Proporciona un fundamento común para los sistemas de tipos más exóticos, incluidas las clases de tipos , notaciones extensiblesy subtipos , y permite formular con precisión restricciones específicas para tipos polimórficos específicos, estableciendo así la relación entre paramétrico y ad-hoc polimorfismo ( sobrecarga ), y entre sobrecarga explícita e implícita. La asociación de un tipo con un predicado en esta teoría sellama evidencia . Se formula un álgebra similar al cálculo lambda para la evidencia , incluida la abstracción de la evidencia, la aplicación de la evidencia, etc. La correlación de un término de esta álgebra con una función explícitamente sobrecargadase denomina traducción de la evidencia .  

Ejemplos motivadores para el desarrollo de una teoría generalizada fueron las clases de tipos de Wadler-Blott y la tipificación de registros extensibles a través de predicados de Harper-Pearce [5] [6] .

Clasificación de los sistemas polimórficos

Los sistemas de tipo paramétricamente polimórficos se clasifican fundamentalmente según el rango y la propiedad predicativa . Además, se distinguen polimorfismos explícitos e implícitos [7] y una serie de otras propiedades. El polimorfismo implícito se proporciona a través de la inferencia de tipos , lo que mejora en gran medida la usabilidad pero tiene una expresividad limitada. Muchos lenguajes polimórficos paramétricamente prácticos separan las fases de un lenguaje externo tipificado implícitamente y un lenguaje interno tipificado explícitamente .  

La forma más general de polimorfismo es el " polimorfismo impredicativo de rango superior ". Las restricciones más populares de esta forma son el polimorfismo de rango 1 llamado " prenex " y el polimorfismo predicativo . Juntos forman un " polimorfismo prenex predicativo " similar al implementado en ML y versiones anteriores de Haskell .

A medida que los sistemas de tipos se vuelven más complejos, las firmas de tipos se vuelven tan complejas que muchos investigadores consideran que su derivación completa o casi completa es una propiedad crítica, cuya ausencia hará que el lenguaje no sea adecuado para la práctica [8] [9] . Por ejemplo, para un combinador tradicional, la mapfirma de tipo completa (teniendo en cuenta la cuantificación genérica ) bajo el seguimiento de flujo de excepción de tipo seguro toma la siguiente forma [10] [8] (como arriba , significa una lista de elementos de tipo ):[a]a

Rango

El rango de polimorfismo muestrala profundidad de anidamiento de cuantificadores de tipo variables permitidas dentro del marco del sistema . El " polimorfismo de rango k " (para k > 1 ) le permite especificar variables de tipo mediante tipos polimórficos de rango no superior a ( k - 1) . El " polimorfismo de rangos superiores " le permite colocar cuantificadores de variables de tipo a la izquierda denúmero arbitrario de flechas en tipos de órdenes superiores .

Joe Wells demostró [ 11] que la inferencia de tipo para un  Sistema F tipo Curry no es decidible para rangos superiores a 2, por lo que se debe usar una anotación de tipo explícita cuando se usan rangos más altos [12] .

Hay sistemas de tipos inferenciales parciales que solo requieren que se anoten variables de tipos no derivables [13] [14] [15] .

Polimorfismo Prenex

El polimorfismo de rango 1 a menudo se denomina polimorfismo prenex (de la palabra "prenex"; consulte la forma normal de prenex ). En un sistema polimórfico prenex , las variables de tipo no pueden ser instanciadas por tipos polimórficos. Esta limitación hace que la distinción entre tipos monomórficos y polimórficos sea esencial, razón por la cual en el sistema prenex los tipos polimórficos a menudo se denominan " tipificación de esquemas " ( type schemas en inglés  ) para distinguirlos de los tipos "ordinarios" (monomórficos) (monotipos). Como consecuencia, todos los tipos se pueden escribir en la forma cuando todos los cuantificadores de variables de tipo se colocan en la posición más externa (prenex), que se denomina forma normal prenex . En pocas palabras, las definiciones de funciones polimórficas están permitidas, pero las funciones polimórficas no se pueden pasar como argumentos a otras funciones [16] [17]  : las funciones definidas polimórficamente deben instanciarse en monotipo antes de su uso.

Un equivalente cercano es el llamado " polimorfismo Let " o " polimorfismo estilo ML " de Damas-Milner. Técnicamente, Let-polimorfismo en ML tiene restricciones sintácticas adicionales, como la " restricción de valor " asociada con problemas de seguridad de tipos al usar referencias (que no ocurren en lenguajes puros como Haskell y Clean ) [18] [19] .

Predicatividad

Polimorfismo predicativo

El polimorfismo predicativo (condicional) requiere que una variable de tipo sea instanciada con un monotipo (no un politipo).

Los sistemas predicativos incluyen la teoría de tipo intuicionista y Nuprl .

Polimorfismo impredicativo

El polimorfismo impredicativo (incondicional) le permite instanciar una variable de tipo con un tipo arbitrario , tanto monomórfico como polimórfico, incluido el tipo que se está definiendo. (Permitir, dentro de un cálculo, que un sistema se incluya recursivamente en sí mismo se llama impredicatividad . Potencialmente, esto puede llevar a paradojas como las de Russell o Cantor [20] , pero esto no sucede en el caso de un sistema de tipo elaborado [21] .)

El polimorfismo impredicativo permite pasar funciones polimórficas a otras funciones como parámetros, devolverlas como resultado, almacenarlas en estructuras de datos, etc., por lo que también se le llama polimorfismo de primera clase . Esta es la forma más poderosa de polimorfismo, pero por otro lado presenta un serio problema para la optimización y hace irresoluble la inferencia de tipos .

Un ejemplo de un sistema impredicativo es el Sistema F y sus extensiones (ver cubo lambda ) [22] .

Soporte de recursividad

Tradicionalmente, en los descendientes de ML , una función solo puede ser polimórfica cuando se ve "desde afuera" (es decir, se puede aplicar a argumentos de varios tipos), pero su definición solo puede contener recursividad monomórfica (es decir, la resolución de tipo es hecho antes de la llamada). Extender la reconstrucción de tipos ML a tipos recursivos no presenta serias dificultades. Por otro lado, la combinación de reconstrucción de tipos con términos definidos recursivamente crea un problema difícil conocido como recursividad polimórfica . Mycroft y Meertens propusieron una regla de escritura polimórfica que permite instanciar llamadas recursivas a una función recursiva desde su propio cuerpo con diferentes tipos. En este cálculo, conocido como cálculo de Milner-Mycroft, la inferencia de tipo es indecidible . [23]

Polimorfismo de tipo estructural

Los tipos de productos (también conocidos como " registros ") sirven como base formal para la programación modular y orientada a objetos . Su par dual se compone de tipos de suma (también conocidos como " variantes ") [24] [25] [19] :

Juntos son un medio de expresar cualquier estructura de datos compleja y algunos aspectos del comportamiento de programas .

Record calculi es un  nombre generalizado para el problema y varias de sus soluciones relacionadas con la flexibilidad de los tipos de productos en los lenguajes de programación bajo la condición de seguridad de tipos [26] [27] [28] . El término a menudo se extiende a los tipos de suma, y ​​los límites del concepto de " tipo de registro " pueden variar de cálculo a cálculo (así como el propio concepto de " tipo "). También se utilizan los términos " polimorfismo de registro " (que, de nuevo, a menudo incluye polimorfismo variante ) [27] , " cálculo de módulo " [9] y " polimorfismo estructural ".

Información general

Los productos de tipo y las sumas ( registros y variantes [ en ] brindan flexibilidad en la construcción de estructuras de datos complejas, pero las limitaciones de muchos sistemas de tipo de la vida real a menudo impiden que su uso sea verdaderamente flexible. Estas limitaciones suelen surgir debido a problemas de eficiencia, inferencia de tipos o simplemente usabilidad. [29]

El ejemplo clásico es Standard ML , cuyo sistema de tipos se limitó deliberadamente lo suficiente como para combinar la facilidad de implementación con la expresividad y la seguridad de tipos demostrable matemáticamente .

Ejemplo de definición de registro :

> val r = { nombre = "Foo" , usado = verdadero }; (* val r : {nombre : cadena, usado : bool} = {nombre = "Foo", usado = verdadero} *)

El acceso al valor del campo por su nombre se realiza mediante una construcción de prefijo de la forma #field record:

> valor r1 = #nombre r ; (* val r1: cadena = "Foo" *)

La siguiente definición de función sobre el registro es correcta:

> divertido nombre1 ( x : { nombre : cadena , edad : int }) = #nombre x

Y lo siguiente genera un error del compilador de que el tipo no está completamente resuelto :

> divertido nombre2 x = #nombre x (* tipo no resuelto en la declaración: {nombre: '1, ...} *)

El monomorfismo de los registros los hace inflexibles, pero efectivos [30] : dado que la ubicación real de la memoria de cada campo de registro se conoce de antemano (en el momento de la compilación), referirse a él por su nombre se compila en una indexación directa, que generalmente se calcula en una máquina. instrucción. Sin embargo, al desarrollar sistemas escalables complejos, es deseable poder abstraer campos de registros específicos, por ejemplo, para definir un selector de campo universal:

divertido seleccionar r l = #l r

Pero compilar el acceso polimórfico a campos que pueden estar en diferente orden en diferentes registros es un problema difícil, tanto desde el punto de vista del control de seguridad de las operaciones a nivel de lenguaje como desde el punto de vista del rendimiento a nivel de código de máquina. Una solución ingenua podría ser buscar dinámicamente el diccionario en cada llamada (y los lenguajes de secuencias de comandos lo usan), pero obviamente esto es extremadamente ineficiente. [31]

Las sumas de tipos forman la base de la expresión de rama y, debido a la rigurosidad del sistema de tipos, el compilador proporciona control sobre la integridad del análisis. Por ejemplo, para el siguiente tipo de suma :

tipo de datos 'a foo = A de 'a | B de ( 'a * 'a ) | C

cualquier función sobre ella se verá como

fun bar ( p : 'a foo ) = caso p de A x => ... | segundo ( x , y ) => ... | c => ...

y cuando se elimine cualquiera de las cláusulas, el compilador emitirá una advertencia de análisis incompleto (" match nonexhaustive"). Para los casos en los que solo unas pocas de las muchas opciones requieren análisis en un contexto dado, es posible organizar defaultramificaciones utilizando los llamados. "Joker": una muestra universal, con la que todos los valores válidos (según el tipo) son comparables. Se escribe con un guión bajo (" _"). Por ejemplo:

fun bar ( p : 'a foo ) = caso p de C => ... | _ => ...

En algunos idiomas (en Standard ML , en Haskell ), incluso la construcción "más simple" if-then-elsees solo azúcar sintáctica sobre un caso especial de ramificación , es decir, la expresión

si A entonces B si no C

ya en la etapa de análisis gramatical se presenta en la forma

caso A de verdadero => B | falso => ​​C

o

caso A de verdadero => B | _ => C

Azúcar sintáctico

En Standard ML , los registros y las variantes son monomórficos; sin embargo, se admite el azúcar sintáctico para tratar con registros con múltiples campos, denominado " patrón universal " [32] :

> val r = { nombre = "Foo" , usado = verdadero }; (* val r : {nombre : string, used : bool} = {name = "Foo", used = true} *) > val { used = u , ...} = r ; (* val u : bool = verdadero *)

Los puntos suspensivos en el {used, ...}tipo “ ” significa que existen otros campos en este registro, además de los mencionados. Sin embargo, no hay polimorfismo de registro como tal (ni siquiera el prenex ): se requiere una resolución estática completa de la información de tipo de registro monomórfico (a través de inferencia o anotación explícita ).

Ampliación y actualización funcional de registros

El término registros extensibles se usa para una designación generalizada de operaciones tales como expansión (construir un nuevo registro basado en uno existente con la adición de nuevos campos), corte (tomar una parte específica de un registro existente), etc. En particular, implica la posibilidad de la llamada " actualización de registro funcional " ( actualización de registro funcional ) - la operación de construir un nuevo valor de registro basado en el existente copiando los nombres y tipos de sus campos, en el que uno o más campos en el nuevo registro recibe nuevos valores que difieren de los originales (y posiblemente tengan un tipo diferente). [33] [34] [19] [35] [36] [37]

Por sí mismas, las operaciones de actualización y extensión funcionales son ortogonales para registrar polimorfismos, pero su uso polimórfico es de particular interés. Incluso para registros monomórficos, es importante poder omitir la mención explícita de campos que se copian sin cambios, y esto en realidad representa polimorfismo de registro en la forma puramente sintáctica . Por otro lado, si consideramos que todos los registros en el sistema son extensibles, esto permite que las funciones en los registros se escriban como polimórficas.

Un ejemplo de la variante de diseño más simple se implementa en Alice ML (de acuerdo con las convenciones sucesoras actuales de ML ) [36] . El patrón universal (puntos suspensivos ) tiene capacidades extendidas: se puede usar para "capturar una fila" para trabajar con la parte "restante" del registro como un valor:

> val r = { a = 1 , b = verdadero , c = "hola" } (* r = {a = 1, b = verdadero, c = "hola"} *) > val { a = n , ... = r1 } = r (* r1 = {b=verdadero, c="hola"} *) > val r2 = { d = 3.14 , ... = r1 } (* r2 = {b=verdadero, c="hola ", d=3,14} *)

La actualización funcional se implementa como un derivado de capturar una fila con una palabra de servicio where. Por ejemplo, el siguiente código:

> sea val r = { a = 1 , c = 3.0 , d = "no es una lista" , f = [ 1 ], p = [ "no es una cadena" ], z = NINGUNO } in { r donde d = nil , p = "hola" } fin

se reescribirá automáticamente en la forma:

> let val r = { a = 1 , c = 3.0 , d = "no es una lista" , f = [ 1 ], p = [ "no es una cadena" ], z = NINGUNO } val { d = _, p = _, ... = tmp } = r en { ... = tmp , d = nil , p = "hola" } fin

Concatenación de registros

Uno de los primeros (finales de los 80  - principios de los 90 ) propuso varias opciones para formalizar registros expandibles a través de operaciones de concatenación en registros no polimórficos (Harper-Pearce [38] , Wand [39] , Salzmann [40] ). Cardelli incluso usó operaciones de registro en lugar de polimorfismo en el idioma ámbar. No existe una forma conocida de compilar estos cálculos de manera eficiente; además, estos cálculos son muy complejos desde el punto de vista del análisis de la teoría de tipos . [27] [41] [42] [43]

Por ejemplo [33] :

val coche = { nombre = "Toyota" ; edad = "viejo" ; id = 6678 } val camión = { nombre = "Toyota" ; id = 19823235 } ... val reparado_camión = { auto y camión }

polimorfismo de fila ) mostró que la herencia múltiple se puede modelar a través de la concatenación de registros [39] [33] .

Subtipado estructural por Cardelli

Luca Cardelli exploró la posibilidad de  formalizar el " polimorfismo de registros " a través de relaciones de subtipificación en los registros: para ello, un registro se trata como un "subtipo universal", es decir, se permite que su valor se refiera a todo el conjunto de sus supertipos. Este enfoque también admite la herencia de métodos y sirve como base teórica de tipos para las formas más comunes de programación orientada a objetos . [27] [44] [45]

Cardelli presentó una variación del método de compilación de polimorfismos de registros a través de sus subtipos al predefinir el desplazamiento de todas las etiquetas posibles en una estructura potencialmente enorme con muchas ranuras vacías [31] .

El método tiene importantes inconvenientes. El soporte para subtipado en el sistema de tipos complica enormemente el mecanismo de verificación de consistencia de tipos [46] . Además, en su presencia, el tipo estático de la expresión deja de brindar información completa sobre la estructura dinámica del valor de la entrada . Por ejemplo, cuando se usan solo subtipos, el siguiente término:

> si es verdadero entonces { A = 1 , B = verdadero } más { B = falso , C = "Gato" } (* val it : {B : bool} *)

tiene tipo {B : bool}, pero su valor dinámico es igual a {A = 1, B = true}, es decir, se pierde información sobre el tipo del registro expandido [43] , lo cual es un problema serio para verificar operaciones que requieren información completa sobre la estructura de valor para su ejecución (como comparación para la igualdad ) [19] . Finalmente, en presencia de subtipos, la elección entre la representación ordenada y desordenada de los registros afecta seriamente el rendimiento [47] .

La popularidad de la subtipificación se debe al hecho de que brinda soluciones simples y visuales a muchos problemas. Por ejemplo, los objetos de diferentes tipos se pueden colocar en una sola lista si tienen un supertipo común [48] .

Polimorfismo de fila de Wanda

Mitchell Wand en 1987  propuso la(no especificada explícitamente) del registro a través de lo que denominó variable de tipo fila ( row type variable ) [49] .

Una variable de fila  es una variable de tipo que se ejecuta a través de un conjunto de conjuntos finitos (filas) de campos escritos (pares de " (значение : тип)"). El resultado es la capacidad de implementar la herencia de amplitud directamente sobre el polimorfismo paramétrico que sustenta ML sin complicar el sistema de tipos con reglas de subtipado El tipo de polimorfismo resultante se llama polimorfismo de fila . El polimorfismo en línea se extiende tanto a productos de tipos como a sumas de tipos .

Vand tomó prestado el término del inglés.  fila (fila, cadena, línea) de Algol-68 , donde significaba un conjunto de vistas. En la literatura en lengua rusa, este término en el contexto de Algol se ha traducido tradicionalmente como "multiespecies". También hay una traducción de "variables de fila" como "variables de cadena" [41] , lo que puede causar confusión con letras minúsculas en tipos de cadena .

Ejemplo ( lenguaje OCaml ; sintaxis de postfijo record#field) [50] :

# let send_m a = a # m ;; (* valor send_m : < m : a; .. > -> a = <diversión> *)

Aquí, los puntos suspensivos (de dos puntos) es la sintaxis aceptada de OCaml para una variable de tipo en línea sin nombre . Debido a tal tipo, la función send_mse puede aplicar a un objeto de cualquier tipo de objeto (no conocido previamente ), que incluye un método de la mfirma correspondiente.

La deducción de tipo para el cálculo de Wanda en la versión original estaba incompleta: debido a la falta de restricciones en la expansión de la serie, agregar un campo si el nombre coincide reemplazará al existente; como resultado, no todos los programas tienen un tipo principal [6] [43] . Sin embargo, este sistema fue la primera propuesta concreta para extender ML con registros que admiten herencia [51] . En años posteriores, se propusieron una serie de mejoras diferentes, incluidas las que lo completan [51] [27] .

El rastro más notable lo dejó Didier Remy ( francés:  Didier Rémy ). Construyó un sistema de tipo práctico con registros extensibles, incluido un algoritmo de reconstrucción de tipo completo y eficiente [52] [53] . Remy estratifica el lenguaje de tipos en géneros , formulando un álgebra de tipos ordenados ( eng.  álgebra de tipos ordenados, lenguaje de tipos ordenados ). Se hace una distinción entre el tipo de tipos propiamente dicho (incluidos los tipos de campo) y el tipo de campos ; se introducen mapeos entre ellos y, sobre su base, se formulan las reglas para escribir registros expandidos como una simple extensión de las reglas clásicas de ML . La información de presencia de un  campo se define como un mapeo de una ordenación por tipo a una ordenación por campo . Las variables de tipo fila se reformulan como variables pertenecientes al género de campo e iguales a la constante de ausencia , que es un  elemento del género de campo que no tiene coincidencia en el género de tipo . Una operación de evaluación de tipo para un registro de n campos se define como el mapeo de un campo n-ario a un tipo (donde cada campo en la tupla es calculado por la función de presencia o dado por la constante de ausencia ).

De forma simplificada, la idea de cálculo puede interpretarse como una extensión del tipo de cualquier campo del registro con flag de presencia/ausencia y representación del registro como una tupla con un slot para cada campo posible [6] . En el prototipo de implementación, la sintaxis del lenguaje de tipos se acercó más a la formulación de la teoría de tipos , por ejemplo [52] :

# let car = { nombre = "Toyota" ; edad = "viejo" ; identificación = 7866 } ;; (* coche : ∏ (nombre : pre (cadena); id : pre (num); edad : pre (cadena); abs) *) # let truck = { nombre = "Blazer" ; identificación = 6587867567 } ;; (* camión : ∏ (nombre : pre (cadena); id : pre (num); abs) *) # dejar persona = { nombre = "Tim" ; edad = 31 ; identificación = 5656787 } ;; (* persona : ∏ (nombre : pre (cadena); id : pre (num); edad : pre (num); abs) *)

(el símbolo ∏en Remy significa el tipo de operación de cálculo)

Agregar un nuevo campo se escribe usando la construcción with:

# let conductor = { persona con vehículo = coche } ;; (* conductor : ∏ (vehículo : pre (∏ (nombre : pre (cadena); id : pre (num); edad : pre (cadena); abs)); nombre : pre (cadena); id : pre (num) ; edad : pre (num); abs) *)

La actualización funcional está escrita de manera idéntica, con la diferencia de que mencionar un campo ya existente lo anula:

# let truck_driver = { conductor con vehículo = camión };; (* camionero: ∏ (vehículo: pre (∏ (nombre: pre (cadena); id: pre (num); abs)); nombre: pre (cadena); id: pre (num); edad: pre (num) ); abdominales) *)

Este esquema formaliza la restricción necesaria para verificar operaciones en registros e inferir el tipo principal, pero no conduce a una implementación obvia y eficiente [6] [43] . Remy usa hashing, que es bastante eficiente en promedio, pero aumenta la sobrecarga del tiempo de ejecución incluso para programas monomórficos nativos, y no es adecuado para registros con muchos campos [31] .

Rémy continuó explorando el uso del polimorfismo en línea junto con la subtipificación de datos , enfatizando que estos son conceptos ortogonales y mostrando que los registros se vuelven más expresivos cuando se usan juntos [54] . Sobre esta base, junto con Jérôme Vouillon ,  propuso una extensión ligera orientada a objetos para ML [55] . Esta extensión se implementó en el lenguaje "Caml Special Light" de Xavier Leroy , convirtiéndolo en OCaml [56] . El modelo de objetos OCaml está estrechamente entrelazado con el uso de subtipos estructurales y polimorfismo en línea [48] , por lo que a veces se identifican erróneamente. El polimorfismo de producto en línea en OCaml está en el centro de la inferencia de tipos ; Las relaciones de subtipificación no son necesarias en un idioma compatible, pero aumentan aún más la flexibilidad en la práctica [55] [50] [48] . OCaml tiene una sintaxis más simple y descriptiva para la información de tipos.

Jacques Garrigue ( fr.  Jacques Garrigue ) implementó [25] un sistema práctico de sumas polimórficas . Combinó el trabajo teórico de Remi y Ohori , construyendo un sistema que se ejecuta en el medio: la información sobre la presencia de etiquetas en un registro se representa usando géneros , y la información sobre sus tipos usa variables en línea. Para que el compilador distinga entre sumas polimórficas y monomórficas, Garriga utiliza una sintaxis especial (comilla grave, etiqueta de prefijo). Esto elimina la necesidad de una declaración de tipo: puede escribir funciones inmediatamente y el compilador generará una lista mínima de etiquetas a medida que se componen estas funciones. Este sistema se convirtió en parte de OCaml alrededor del año 2000 , pero no en lugar de , sino además de las sumas monomórficas , ya que son un poco menos eficientes y, debido a la incapacidad de controlar la integridad del análisis , dificultan la búsqueda de errores (a diferencia del método de Bloom). solución ). [25] [57]

Las desventajas del polimorfismo en línea de Wand son la falta de evidencia de la implementación (no existe una única forma sistemática de compilarlo, cada sistema de tipo específico basado en variables en línea tiene su propia implementación) y la relación ambigua con la teoría (no existe un sistema uniforme). formulación para verificación de tipos e inferencia , el soporte para inferencia se resolvió por separado y requirió experimentos con la imposición de varias restricciones) [27] .

Sumas translúcidas de Harper-Lilybridge

El tipo más complejo de registros son los registros dependientes . Dichos registros pueden incluir tanto tipos como valores "ordinarios" (tipos materializados, cosificados [9] ), y los términos y tipos siguientes en orden en el cuerpo del registro pueden determinarse en función de los que los preceden. . Tales notaciones corresponden a las " sumas débiles " de la teoría de tipos dependientes , también conocidas como " existenciales ", y sirven como la justificación más general para sistemas de módulos en lenguajes de programación [58] [59] . Cardelli consideró [60] tipos similares en propiedades como uno de los tipos principales en la programación de tipo completo (pero los llamó " tuplas ").

Robert Harper y Mark  Lillibridge construyeron [61 ] [59] el cálculo translúcido de sumas parajustificar formalmente un lenguaje de módulo de primera clase de orden superior , el sistema de módulos  más avanzadoconocido. Este cálculo, entre otras cosas, se utiliza en la semántica de Harper-Stone , que representajustificación de la teoría de tipos para el aprendizaje automático estándar .  

Las sumas translúcidas generalizan sumas débiles a través de etiquetas y un conjunto de igualdades que describen constructores de tipos . El término translúcido significa que un tipo de registro puede contener tanto tipos con una estructura explícitamente exportada como completamente abstractos  . La capa de géneros en cálculo tiene una composición clásica simple: se distinguen el género de todos los tipos y los géneros funcionales del tipo , constructores de tipos de tipos ( ML no admite polimorfismo en géneros superiores , todas las variables de tipo pertenecen al género , y la abstracción de constructores de tipos solo es posible a través de funtores [62 ] ). El cálculo distingue entre reglas de subtipificación para registros como tipos básicos y para campos de registros como sus constituyentes, respectivamente, considerando "subtipos" y "subcampos", mientras que oscurecer (resumir) las firmas de campo es un concepto separado de la subtipificación. Subtipificar aquí formaliza el mapeo de módulos a interfaces . [61] [9]

El cálculo de Harper-Lilybridge es indecidible incluso en términos de verificación de consistencia de tipo ( los dialectos del idioma del módulo implementados en Standard ML y OCaml usan subconjuntos limitados de este cálculo). Más tarde, sin embargo, Andreas  Rossberg , basado en sus ideas, construyó el lenguaje “ 1ML ”, en el que los registros tradicionales del nivel central del lenguaje y las estructuras a nivel de módulo son la misma construcción de primera clase [9] (significativamente más expresiva que Cardelli's: consulte la crítica del lenguaje del módulo ML ). Al incorporar la idea de Harper y Mitchell [63] sobre subdividir todos los tipos en universos de tipos “pequeños” y “grandes” (simplificado, esto es similar a la división fundamental de tipos en tipos simples y agregados, con reglas de escritura desiguales), Rossberg proporcionó resolubilidad no solo comprobaciones de consistencia , sino también una inferencia de tipos casi completa . Además, 1ML permite polimorfismo impredicativo [64] . Al mismo tiempo, el lenguaje interno en 1ML se basa en el Sistema plano F ω y no requiere el uso de tipos dependientes como metateoría. A partir de 2015, Rossberg dejó abierta la posibilidad de agregar polimorfismo en línea a 1ML , y solo señaló que esto debería proporcionar una inferencia de tipos más completa [9] . Un año más tarde, añadió [65] el polimorfismo de efectos a 1ML .

Cálculo polimórfico de los registros de Ohori

Atsushi Ohori , junto  con su supervisor Peter Buneman , propusieron en 1988 la idea de limitar el rango de valores posibles de las variables de tipo ordinario en la tipificación polimórfica de los propios registros . Más tarde, Ohori formalizó esta idea a través de la notación general , habiendo construido en 1995 un cálculo completo y un método para su compilación eficiente [19] [30] . El prototipo de implementación se creó en 1992 como una extensión del compilador SML/NJ [66] , luego Ohori lideró el desarrollo de su propio compilador SML# , que implementa el dialecto ML estándar del mismo nombre . En SML# , el polimorfismo de registro sirve como base para incorporar sin problemas construcciones SQL en programas SML . SML# es utilizado por grandes empresas japonesas para resolver problemas comerciales asociados con bases de datos de alta carga [67] . Un ejemplo de tal sesión ( REPL ) [68] :  

divertido rico { Salario = s , ... } = s > 100000 ; (* val rico = fn : 'a#{ Salario:int, ... } -> bool *) divertido joven x = #Edad x < 24 ; (* val young = fn : 'a#{ Edad:int, ... } -> bool *) divertido youngAndWealthy x = rico x y también joven x ; (* val jovenyrico = fn : 'a#{ Edad:int, Salario:int, ... } -> bool *) fun select display l pred = fold ( fn ( x , y ) => if pred x then ( display x ) ::y else y ) l nil ; (* val select = fn : ('a -> 'b) -> 'una lista -> ('a -> bool) -> 'b lista *) fun youngAndWealthyEmployees l = select #Name l youngAndWealthy ; (* val empleadosjóvenesyricos = fn : 'b#{ Edad:int, Nombre:'a, Salario:int, ... } lista -> 'una lista *)

Ohori llamó a su cálculo " polimorfismo de registros " ( en inglés  record polymorphism ) o " polimorphic record calculus " ( cálculo de registros polimórficos en inglés  ), al mismo tiempo que enfatizaba que él, al igual que Wand, considera el polimorfismo no solo de tipos de productos , sino también de tipos- sumas [27] .

El cálculo de Ohori se distingue por el uso más intensivo de la capa de géneros [6] . En la entrada (tipo de referencia a género ), el símbolo significa el género de todos los tipos ; o el género de registros , que tiene la forma , que denota el conjunto de todos los registros que contienen al menos los campos especificados; o un género variante que tiene la forma que denota el conjunto de todos los tipos variantes que contienen al menos los constructores especificados . En la sintaxis plana del lenguaje, una restricción de tipo para algún tipo de notación se escribe como (vea los ejemplos anteriores). La solución es algo similar a la cuantificación restringida Cardelli-Wegner [27] . t#{...}

La única operación polimórfica proporcionada por este cálculo es la operación de extracción de campos [69] . Sin embargo, Ohori fue el primero en introducir un esquema de compilación simple y eficiente para el registro de polimorfismo [43] . Lo llamó el "cálculo de realizaciones" ( implementation calculus ). Un registro está representado por un vector ordenado lexicográficamente por los nombres de campo del registro original; direccionar un campo por su nombre se traduce en una llamada a una función intermedia que devuelve el número del campo dado en el vector dado por el nombre solicitado, y la subsiguiente indexación del vector por el número de posición calculado. La función se llama solo cuando se crean instancias de términos polimórficos, lo que impone una sobrecarga mínima en el tiempo de ejecución cuando se usa polimorfismo y no impone ninguna sobrecarga cuando se trabaja con tipos monomórficos. El método funciona igualmente bien con entradas y variantes arbitrariamente grandes. El cálculo proporciona inferencia de tipos y encuentra una fuerte correspondencia con la teoría (la cuantificación genérica está directamente relacionada con la indexación vectorial habitual ), siendo una extensión directa del cálculo lambda de segundo orden de Girard-Reynolds , que permite varias propiedades bien conocidas de polimórficos. escribir para ser transferido al registro de polimorfismo [31] .

En la práctica, el soporte para variantes polimórficas en SML# no se ha implementado debido a su incompatibilidad con el mecanismo de definición de tipo de suma de Standard ML (requiere separación sintáctica de sumas y tipos recursivos) [70] .

La desventaja del cálculo de Ohori es la falta de soporte para operaciones de expansión o truncamiento de registros [27] [71] [43] .

Marcas Guster-Jones de primera clase

En la teoría de tipos cualificados, los registros expandibles se describen por la ausencia de un campo ( predicado "carece" ) y la presencia de un predicado de campo ( predicado "has" ). Benedict Gaster ( Benedict R. Gaster ) junto con el autor de la teoría Mark Jones ( Mark P. Jones ) la finalizaron en términos de registros extensibles a un sistema de tipo práctico de lenguajes tipificados implícitamente, incluyendo la definición del método de compilación [6] . Acuñan el término etiquetas de primera clase para enfatizar la capacidad de abstraer operaciones de campo a partir de etiquetas estáticamente conocidas. Posteriormente, Gaster defendió su disertación [72] sobre el sistema construido .

El cálculo de Gaster-Jones no proporciona una inferencia de tipo completo . Además, por problemas de decidibilidad, se impuso una restricción artificial: la prohibición de series vacías [73] . Sulzmann intentó reformular el cálculo [40] , pero el sistema que construyó no se puede extender para admitir la expansión de registros polimórficos y no tiene un método de compilación eficiente universal [43] .

Daan Leijen agregó un predicado de igualdad de filas (o predicado de igualdad de filas ) al cálculo de Gaster-Jones y movió el lenguaje de series al lenguaje de predicados; esto aseguró la inferencia de tipo completa y levantó la prohibición de series vacías [74] . Cuando se compilan, los registros se convierten en una tupla ordenada lexicográficamente y la traducción de evidencia se aplica de acuerdo con el esquema Gaster-Jones. El sistema de Layen permite la expresión de expresiones idiomáticas como mensajes de orden superior (la forma más poderosa de programación orientada a objetos ) y ramas de primera clase .  

En base a estos trabajos, se han implementado extensiones al lenguaje Haskell [75] .

Los resultados de Gaster-Jones son muy cercanos a los de Ohori , a pesar de las diferencias significativas en la justificación teórica de tipos , y la principal ventaja es el soporte para operaciones de expansión y truncamiento de registros [6] . La desventaja del cálculo es que se basa en propiedades del sistema de tipos que no se encuentran en la mayoría de los lenguajes de programación. Además, la inferencia de tipos es un problema grave, por lo que los autores han impuesto restricciones adicionales. Y aunque Layen ha eliminado muchas de las deficiencias, no es posible usar -branch . [71]default

Polimorfismo de construcción de control

Con el desarrollo de los sistemas de software, la cantidad de opciones en el tipo de suma puede aumentar , y agregar cada opción requiere agregar una rama correspondiente a cada función sobre este tipo, incluso si estas ramas son idénticas en diferentes funciones. Por lo tanto, la complejidad de aumentar la funcionalidad en la mayoría de los lenguajes de programación depende de forma no lineal de los cambios declarativos en los términos de referencia. Este patrón se conoce como el problema de la expresión . Otro problema bien conocido es el manejo de excepciones : a lo largo de las décadas de investigación en sistemas de tipos , todos los lenguajes clasificados como seguros para tipos aún podrían salir lanzando una excepción no detectada, porque, a pesar de escribir las excepciones en sí, el mecanismo para generar y su manejo no estaba tipificado. Si bien se han creado herramientas para analizar el flujo de excepciones, estas herramientas siempre han sido externas al lenguaje.

Matthias Blume , un  colega de Andrew Appel que trabaja en el sucesor del proyecto ML [76] ), su estudiante de posgrado Wonseok Chae y su colega Umut Acar resolvieron ambos problemas basados ​​en la dualidad matemática productos y sumas . La materialización de sus ideas fue el lenguaje MLPolyR [71] [34] [77] , basado en el subconjunto más simple de Standard ML y complementándolo con varios niveles de seguridad de tipos [78] . Wonseok Chai luego defendió su disertación sobre estos logros [78] .

La solución es la siguiente. Según el principio de dualidad, la forma de introducción de un  concepto corresponde a la forma de eliminación de su dual [71] . Así, la forma eliminatoria de las sumas (análisis de ramas) corresponde a la forma introductoria de los registros. Esto fomenta que la bifurcación tenga las mismas propiedades que ya están disponibles para las entradas: convertirlas en objetos de primera clase y permitir que se extiendan.  

Por ejemplo, el intérprete de lenguaje de expresión más simple:

fun eval e = caso e de `Const i => i | `Más (e1,e2) => eval e1 + eval e2

con la introducción de la construcción de primera clase casesse puede reescribir como:

fun eval e = emparejar e con casos `Const i => i | `Más (e1,e2) => eval e1 + eval e2

después de lo cual casesse puede representar el bloque:

fun eval_c eval = casos `Const i => i | `Más (e1,e2) => eval e1 + eval e2 fun eval e = unir e con ( eval_c eval)

Esta solución permite default-branching (a diferencia del cálculo de Gaster-Jones ), que es importante para la composición de ramas de primera clase [34] . La finalización de la composición de la fila se lleva a cabo con la ayuda de la palabra . nocases

fun const_c d = casos `Const i => i default : d fun plus_c eval d = casos `Plus (e1,e2) => eval e1 + eval e2 predeterminado : d fun eval e = emparejar e con const_c (plus_c eval nocases ) fun bind env v1 x v2 = si v1 = v2 entonces x else env v2 divertido var_c env d = casos `Var v => env v predeterminado : d fun let_c eval env d = cases `Let (v,e,b) => eval (bind env v (eval env e)) b default : d fun eval_var env e = emparejar e con const_c (plus_c (eval_var env) (var_c env (let_c eval_var env nocases )))

Como puede ver, el nuevo código, que debe agregarse con la complicación cualitativa del sistema, no requiere cambiar el código ya escrito (las funciones const_cy plus_c"no saben nada" sobre la posterior adición de soporte para variables y let-blocks para el intérprete de idiomas). Así, los casos extensibles de primera clase son una solución fundamental al problema de la expresión , permitiendo hablar de un paradigma de programación extensible [71] [78] . el polimorfismo en línea , que ya está soportado en el sistema de tipos, y en este sentido, la ventaja de esta solución técnica es su simplicidad conceptual [ 34] .

Sin embargo, extender los sistemas de software también requiere control sobre el manejo de las excepciones que pueden generarse a profundidades arbitrarias de anidamiento de llamadas. Y aquí Bloom y sus colegas proclaman un nuevo eslogan de seguridad de tipos en el desarrollo del eslogan de Milner : " Los programas que pasan la verificación de tipos no lanzan excepciones no controladas ". El problema es que si la firma de tipo de función incluye información sobre los tipos de excepciones que esta función puede generar potencialmente, y esta información en la firma de la función pasada debe ser estrictamente consistente con la información sobre el parámetro de función de orden superior (incluso si este es un conjunto vacío): escribir el mecanismo de manejo de excepciones requiere inmediatamente el polimorfismo de los tipos de las excepciones; de lo contrario, las funciones de orden superior dejan de ser polimórficas. Al mismo tiempo, en un lenguaje seguro, las excepciones son una suma extensible [79] [80] [81] , es decir, un tipo variante cuyos constructores se agregan a medida que avanza el programa. En consecuencia, la seguridad de tipo de flujo de excepción significa la necesidad de admitir tipos de suma que sean tanto extensibles como polimórficos. Aquí nuevamente, la solución es el polimorfismo en línea .

Al igual que el cálculo de Garriga , MLPolyR usa una sintaxis especial para sumas polimórficas (comilla grave, etiqueta principal), y no hay necesidad de una declaración previa del tipo de suma (es decir, el código anterior es el programa completo , no un fragmento). La ventaja es que no hay problema con el control de completitud del análisis: la semántica de MLPolyR se define mediante la conversión a un lenguaje interno de confiabilidad comprobada que no admite polimorfismo de suma ni excepciones (sin mencionar las excepciones no detectadas), por lo que la necesidad de ellos la eliminación en tiempo de compilación es en sí misma una prueba de confiabilidad. [34]

MLPolyR utiliza una combinación no trivial de varios cálculos y traducción en dos etapas. Utiliza el cálculo Remy para la deducción de tipos y la coincidencia de tipos , al mismo tiempo que utiliza el principio de dualidad para representar sumas como productos, luego traduce el lenguaje a un lenguaje intermedio tipificado explícitamente con registros polimórficos y luego usa el método de compilación eficiente de Ohori . En otras palabras, el modelo de compilación de Ohori se ha generalizado para admitir el cálculo de Remy [69] . En el nivel de teoría de tipos , Bloom introduce varias notaciones sintácticas nuevas a la vez, lo que permite escribir reglas para escribir excepciones y ramas de primera clase. El sistema de tipos MLPolyR proporciona inferencia de tipos completa , por lo que los autores abandonaron el desarrollo de una sintaxis plana para escribir tipos explícitamente y soporte para firmas en el lenguaje del módulo .

El sistema de tipos Leyen también introduce una variante del polimorfismo de rama: una construcción se puede representar como una función de orden superior que recibe una entrada de funciones, cada una de las cuales corresponde a una rama particular de computación ( la sintaxis de Haskell es adecuada para este cambio y no requiere revisión). Por ejemplo: case

listadatos a = nil :: { } | contras :: { hd :: a , tl :: Lista a } snoc xs r = caso ( inverso xs ) r ultimo xs = snoc xs { nil = \ r -> _ | _ , contras = \ r -> r . disco duro }

Debido a que los registros en el sistema de Layen son extensibles, el análisis de ramas es flexible a nivel de decisiones dinámicas (como encadenar controles o usar una matriz asociativa ), pero proporciona una implementación mucho más eficiente (la etiqueta de variante corresponde a un desplazamiento en el registro). Sin embargo, el soporte de bifurcación predeterminado ( default) debe eliminarse en este caso, ya que un solo defaultpatrón coincidiría con varios campos (y, por lo tanto, con múltiples compensaciones). Leyen llama a esta construcción " first-class patterns " ( patrones de primera clase ).

Polimorfismo en géneros superiores

Polimorfismo de orden superior significa abstracción  sobre constructores de tipo de orden, es decir, operadores de tipo de la forma

* -> * -> ... -> *

La compatibilidad con esta función lleva el polimorfismo a un nivel superior, proporcionando abstracción sobre tipos y constructores de tipos  , al igual que las funciones de orden superior proporcionan abstracción sobre valores y otras funciones. El polimorfismo en los géneros superiores es un componente natural de muchos lenguajes de programación funcional , incluidas las mónadas , los pliegues y los lenguajes integrados . [62] [82]

Por ejemplo [62] si define la siguiente función ( lenguaje Haskell ):

cuando b m = si b entonces m si no regresa ()

entonces se deducirá para él el siguiente tipo funcional :

cuando :: para todos ( m :: * -> * ) . Mónada m => Bool -> m () -> m ()

La firma m :: * -> *dice que la variable de tipo m es una variable de tipo que pertenece a un tipo superior ( en inglés  , variable de tipo de tipo superior ). Esto significa que se abstrae de los constructores de tipos (en este caso, unarios , como Maybeo []), que se pueden aplicar a tipos concretos, como Into (), para construir nuevos tipos.

En los lenguajes que admiten la abstracción de tipos completos ( Standard ML , OCaml ), todas las variables de tipo deben ser de un género * , de lo contrario, el sistema de tipos no sería seguro . El polimorfismo en los géneros superiores lo proporciona el propio mecanismo de abstracción, combinado con una anotación explícita en la creación de instancias, lo que es un tanto inconveniente. Sin embargo, es posible una implementación idiomática del polimorfismo en géneros superiores, sin necesidad de una anotación explícita; para ello, se utiliza una técnica similar a la desfuncionalización a nivel de tipo . [62]

Polimorfismo genérico

Los sistemas de tipos garantizan la seguridad de los sistemas de tipos mismos alpermitir el control sobre el significado de las expresiones de tipo . 

Por ejemplo, que se requiera implementar en lugar del tipo habitual " vector " (arreglo lineal) la familia de tipos " longitud vectorn ", es decir, definir el tipo " vector indexado por longitud ". La implementación clásica de Haskell se ve así [83] :

data Zero data Succ n data Vec :: * -> * -> * where Nil :: Vec a Zero Cons :: a -> Vec a n -> Vec a ( Succ n )

Aquí, los tipos fantasma [84] se definen primero , es decir, los tipos que no tienen una representación dinámica. Los constructores Zero y Succsirven como "valores de capa de tipo", y la variable nimpone la desigualdad de los diferentes tipos concretos construidos por el constructor Succ. El tipo Vecse define como un tipo de datos algebraicos generalizados (GADT).

La solución asume condicionalmente que el tipo fantasma nse usará para modelar el parámetro entero del vector basado en los axiomas de Peano  , es decir, solo se construirán expresiones como Succ Zero, Succ Succ Zero, Succ Succ Succ Zeroetc.. Sin embargo, aunque las definiciones están escritas en lenguaje de tipos , ellos mismos se formulan de manera no tipificada . Esto se puede ver en la firma Vec :: * -> * -> *, lo que significa que los tipos concretos pasados ​​como parámetros pertenecen al género * , lo que significa que pueden ser cualquier tipo concreto. En otras palabras, las expresiones de tipo sin sentido como Succ Boolo no están prohibidas aquí Vec Zero Int. [83]

Un cálculo más avanzado permitiría especificar el rango del parámetro de tipo con mayor precisión:

datos Nat = Cero | Succ Nat data Vec :: * -> Nat -> * where VNil :: Vec a Zero VCons :: a -> Vec a n -> Vec a ( Succ n )

Pero, por lo general, solo los sistemas altamente especializados con tipos dependientes [85] implementados en lenguajes como Agda , Coq y otros tienen tal expresividad. Por ejemplo, desde el punto de vista del lenguaje Agda , la entrada Vec :: * -> Nat -> *significaría que el género de un tipo Vec depende del tipo Nat(es decir, un elemento de un tipo depende de un elemento de otro tipo inferior ).

En 2012, se creó una extensión del lenguaje Haskell [83] , que implementa un sistema de géneros más avanzado y hace que el código anterior corrija el código Haskell. La solución es que todos los tipos (bajo ciertas restricciones) son automáticamente " promovidos " ( eng. promover ) a un nivel superior, formando géneros del mismo nombre que se pueden usar explícitamente. Desde este punto de vista, la entrada no es dependiente  , solo significa que el segundo parámetro del vector debe pertenecer al género nombrado y, en este caso, el único elemento de este género es el tipo del mismo nombre.  Vec :: * -> Nat -> *Nat

La solución es bastante simple, tanto en términos de implementación en el compilador como en términos de accesibilidad práctica. Y dado que el polimorfismo de tipos es inherentemente un elemento natural de la semántica de Haskell, la promoción de tipos conduce al polimorfismo de tipos , lo que aumenta la reutilización del código y proporciona un mayor nivel de seguridad de tipos .  Por ejemplo, el siguiente GADT se usa para verificar la igualdad de tipos:

datos EqRefl a b donde Refl :: EqRefl a a

tiene un género en Haskell clásico * -> * -> *, lo que evita que se use para probar la igualdad de constructores de tipos como Maybe. Un sistema de género basado en la promoción de tipos infiere un género polimórficoforall X. X -> X -> * , lo que hace que el tipo sea EqReflmás genérico. Esto se puede escribir explícitamente:

data EqRef ( a :: X ) ( b :: X ) donde Ref :: para todas las X . paratodo ( a :: X ) . EqRefl a a

Polimorfismo de efectos

Los sistemas de efectos fueron propuestos por Gifford y Lucassen en la segunda mitad de  la década de 1980 [86] [87] [88] con el objetivo de aislar los efectos secundarios para un control más preciso sobre la seguridad y la eficiencia en la programación competitiva .

En este caso , polimorfismo de efecto significa cuantificación sobre la pureza de una  función específica, es decir, la inclusión de una bandera en el tipo funcional que caracteriza la función como pura o impura. Esta extensión de escritura hace posible abstraer la pureza de las funciones de orden superior de la pureza de las funciones que se les pasan como argumentos.

Esto es de particular importancia cuando se pasa a funciones sobre módulos ( registros que incluyen tipos abstractos ) - funtores  - porque en las condiciones de pureza tienen derecho a ser aplicativos, pero en presencia de efectos secundarios deben generar para garantizar la seguridad del tipo. (Para obtener más información sobre esto, consulte la equivalencia de tipos en el lenguaje del módulo ML ). Por lo tanto, en el lenguaje de los módulos de primera clase de orden superior, el polimorfismo de efecto resulta ser una base necesaria para respaldar el polimorfismo de generatividad : pasar una  bandera de pureza a un funtor permite elegir entre semántica aplicativa y generativa en un solo sistema. [sesenta y cinco]

Soporte en lenguajes de programación

El polimorfismo paramétrico con seguridad de tipos está disponible en Hindley-Milner lenguajes tipificados, en  dialectos ML ( Standard ML , OCaml , Alice , F# ) y sus descendientes ( Haskell , Clean , Idris , Mercury , Agda ), también como en las lenguas híbridas heredadas de ellos ( Scala , Nemerle ).

Los tipos de datos genéricos (genéricos) se diferencian de los sistemas polimórficos paramétricos en que utilizan una cuantificación restringida y, por lo tanto, no pueden tener un rango superior a 1 . Están disponibles en Ada , Eiffel , Java , C# , D , Rust ; y también en Delphi desde la versión 2009. Aparecieron por primera vez en CLU .

Polimorfismo intensional

El polimorfismo intensional es una técnica  de optimización de la compilación de polimorfismo paramétrico basada en un análisis teórico de tipos complejo , que consiste en cálculos de tipos en tiempo de ejecución. El polimorfismo intencional permite la recolección de basura sin etiquetas, elpaso de argumentos a funciones sin caja y estructuras de datos planas en caja (memoria optimizada). [89] [90] [91]

Monomorfización

El monomorfismo es una  técnica para optimizar la compilación de polimorfismo paramétrico, que consiste en generar una instancia monomórfica para cada caso de uso de una función o tipo polimórfico. En otras palabras, el polimorfismo paramétrico en el nivel del código fuente se traduce en polimorfismo ad hoc en el nivel de la plataforma de destino. La monomorfización mejora el rendimiento (más precisamente, hace que el polimorfismo sea "libre"), pero al mismo tiempo, puede aumentar el tamaño del código de máquina de salida . [92]

Hindley - Milner

En la versión clásica , el sistema de tipo Hindley-Milner (también simplemente "Hindley-Milner" o "X-M", inglés  HM ) [93] [94] subyacente al lenguaje ML es un subconjunto del Sistema F , limitado por el predicativo prenex polimorfismo para habilitar la inferencia automática de tipos , para lo cual Hindley-Milner tradicionalmente también incluía el llamado " Algoritmo W " , desarrollado por Robin Milner .

Muchas implementaciones de X-M son una versión mejorada del sistema, representando un  “ esquema de tipado principal[93] [2] que, en un solo paso con una complejidad casi lineal , infiere simultáneamente los tipos polimórficos más generales para cada expresión y verifica estrictamente su acuerdo _

Desde sus inicios , el sistema de tipos Hindley-Milner se ha ampliado de varias formas [95] . Una de las extensiones más conocidas es el soporte para polimorfismo ad-hoc a través de clases de tipos , que se generalizan aún más en tipos calificados .

La inferencia automática de tipos se consideró una necesidad en el desarrollo original de ML como un sistema interactivo de demostración de teoremas " Lógica para funciones computables ", razón por la cual se impusieron las restricciones correspondientes. Posteriormente, sobre la base de ML , se desarrollaron una serie de lenguajes de propósito general compilados de manera eficiente , orientados a la programación a gran escala , y en este caso, la necesidad de soportar la inferencia de tipos se reduce drásticamente, ya que las interfaces de los módulos en la práctica industrial debe en cualquier caso ser anotado explícitamente con tipos [81 ] . Por lo tanto, se han propuesto muchas extensiones de Hindley-Milner que evitan la inferencia de tipos a favor del empoderamiento, hasta e incluyendo el soporte para un Sistema F completo con polimorfismo impredicativo , como el lenguaje de módulo de orden superior , que originalmente se basó en anotación de tipo de módulo explícito y tiene muchas extensiones y dialectos, así como extensiones de lenguaje Haskell ( , y ). Rank2TypesRankNTypesImpredicativeTypes

El compilador MLton de Standard ML monomorfiza , pero debido a otras optimizaciones aplicables a Standard ML , el aumento resultante en el código de salida no supera el 30 % [92] .

C y C++

En C, las funciones no son objetos de primera clase , pero es posible definir punteros de función , lo que le permite construir funciones de órdenes superiores [96] . El polimorfismo paramétrico no seguro también está disponible al pasar explícitamente las propiedades requeridas de un tipo a través de un subconjunto sin tipo del lenguaje representado por un puntero sin tipo ).comunidaden"genéricopuntero(llamado "97][ , dado que no cambia la representación del puntero, sin embargo, está escrito explícitamente para omitir el sistema de tipos del compilador [96] . void* void*

Por ejemplo, la función estándar qsortes capaz de manejar matrices de elementos de cualquier tipo para los que se define una función de comparación [96] .

segmento de estructura { int inicio ; int final ; }; int seg_cmpr ( segmento de estructura * a , segmento de estructura * b ) { return abs ( a -> final - a -> inicio ) - abs ( b -> final - b -> inicio ); } int str_cmpr ( char ** a , char ** b ) { return strcmp ( * a , * b ); } segmentos de segmento de estructura [] = { { 2 , 5 }, { 4 , 3 }, { 9 , 3 }, { 6 , 8 } }; char * strs [] = { "tres" , "uno" , "dos" , "cinco" , "cuatro" }; principal () { qsort ( cadenas , tamaño de ( cadenas ) / tamaño de ( char * ), tamaño de ( char * ), ( int ( * )( vacío * , vacío * )) str_cmpr ); qsort ( segmentos , tamaño de ( segmentos ) / tamaño de ( segmento de estructura ), tamaño de ( segmento de estructura ), ( int ( * )( vacío * , vacío * )) seg_cmpr ); ... }

Sin embargo, en C es posible reproducir idiomáticamente el polimorfismo paramétrico tipado sin usar void*[98] .

El lenguaje C++ proporciona un subsistema de plantilla que parece un polimorfismo paramétrico, pero se implementa semánticamente mediante una combinación de mecanismos ad hoc :

plantilla < nombre de tipo T > T max ( T x , T y ) { si ( x < y ) devolver y ; más devuelve x ; } int principal () { int a = máx ( 10 , 15 ); doble f = máx ( 123.11 , 123.12 ); ... }

La monomorfización de al compilar plantillas de C++ es inevitable porque el sistema de tipos del lenguaje carece de soporte para el polimorfismo: el lenguaje polimórfico aquí es un complemento estático del núcleo del lenguaje monomórfico [99] . Esto conduce a un aumento múltiple en la cantidad de código de máquina recibido , lo que se conoce como " inflación de código " [100] .

Historia

La notación del polimorfismo paramétrico como un desarrollo del cálculo lambda (llamado cálculo lambda polimórfico o Sistema F ) fue formalmente descrita por el lógico Jean-Yves Girard [101] [102] ( 1971 ), independientemente de él una similar El sistema fue descrito por el científico informático John S. Reynolds [103] ( 1974 ) [104] .

El polimorfismo paramétrico se introdujo por primera vez en ML en 1973 [41] [105] . Independientemente de él, los tipos paramétricos se implementaron bajo la dirección de Barbara Liskov en CLU ( 1974 ) [41] .

Véase también

Notas

  1. 1 2 Strachey, "Conceptos fundamentales", 1967 .
  2. 1 2 Pierce, 2002 .
  3. Cardelli, Wegner, "Sobre la comprensión de los tipos", 1985 , 1.3. Tipos de polimorfismo, pág. 6.
  4. 1 2 Appel, "Crítica de SML", 1992 .
  5. 1 2 Jones, "Teoría de los tipos calificados", 1992 .
  6. 1 2 3 4 5 6 7 Gaster, Jones, "Registros extensibles polimórficos y variantes", 1996 .
  7. Cardelli, "Verificación de tipos polimórficos básicos", 1987 .
  8. 1 2 Wonseok Chae (tesis doctoral), 2009 , p. 91-92.
  9. 1 2 3 4 5 6 Rossberg, "1ML - Core and Modules United (F-ing First-class Modules)", 2015 .
  10. Blume, "Controladores de excepciones", 2008 , p. once.
  11. Pozos, 1994 .
  12. Pierce, 2002 , 22 Reconstrucción de tipos, p. 361.
  13. Pierce, 2002 , 23.6 Borrado, tipificación y reconstrucción de tipos, p. 378-381.
  14. Remy, "ML con tipos de registros y abstractos", 1994 .
  15. Garrigue, Remy, "Polimorfismo de primera clase semiexplícito para ML", 1997 .
  16. Reynolds, "Teorías de los lenguajes de programación", 1998 , 17. Polimorfismo. Notas bibliográficas, pág. 393.
  17. Polimorfismo de primera clase en MLton . Consultado el 28 de julio de 2016. Archivado desde el original el 28 de noviembre de 2015.
  18. Pierce, 2002 , 22.7 Polimorfismo vía let, p. 354-359.
  19. 1 2 3 4 5 Ohori, "Cálculo de registros polimórficos y su compilación", 1995 .
  20. Dushkin, "Monomorfismo, polimorfismo y tipos existenciales", 2010 .
  21. Cardelli, "Programación tipificada", 1991 , p. veinte.
  22. Pierce, 2002 , 23.10 Impredicatividad, p. 385.
  23. Pierce, 2002 , Capítulo 22. Reconstrucción de tipos. Sección 22.8. Observaciones adicionales, pág. 361-362.
  24. Wonseok Chae (Tesis doctoral), 2009 , p. catorce.
  25. 1 2 3 Garrigue, "Variantes polimórficas", 1998 .
  26. Blume, "Programación extensible con casos de primera clase", 2006 , p. diez.
  27. 1 2 3 4 5 6 7 8 9 Ohori, "Cálculo de registros polimórficos y su compilación", 1995 , 1.1 Sistema de tipo estático para polimorfismo de registros, p. 3-6.
  28. Leijen, "Etiquetas de primera clase", 2004 , p. una.
  29. Gaster, Jones, "Registros polimórficos extensibles y variantes", 1996 , Resumen, p. una.
  30. 1 2 Paulson, "ML para el programador que trabaja", 1996 , 2.9 Records, p. 35.
  31. 1 2 3 4 Ohori, "Cálculo de registros polimórficos y su compilación", 1995 , 1.2 Método de compilación para polimorfismo de registros, p. 6-8.
  32. Harper, "Introducción a SML", 1986 .
  33. 1 2 3 Remy, "Inferencia de tipos para registros", 1991 , p. 2.
  34. 1 2 3 4 5 Blume, "El polimorfismo de filas en acción", 2007 .
  35. Actualización del registro funcional . Consultado el 30 de junio de 2016. Archivado desde el original el 2 de junio de 2016.
  36. 1 2 Mejoras sintácticas de Alice ML . Consultado el 30 de junio de 2016. Archivado desde el original el 27 de noviembre de 2016.
  37. Extensión de registros funcionales y captura de filas . Consultado el 30 de junio de 2016. Archivado desde el original el 13 de agosto de 2016.
  38. Harper, Pierce, "Cálculo de registros basado en concatenación simétrica", 1991 .
  39. 1 2 Wand, "Inferencia de tipos para concatenación de registros y herencia múltiple", 1991 .
  40. 12 Sulzmann , 1997 .
  41. 1 2 3 4 Pierce, 2002 , 1.4 Breve historia, p. 11-13.
  42. Remy, "Inferencia de tipos para registros", 1991 , p. 2-3.
  43. 1 2 3 4 5 6 7 Leijen, "Etiquetas de primera clase", 2004 , p. 13-14.
  44. Cardelli, "Semántica de herencia múltiple", 1988 .
  45. Cardelli, Wegner, "Sobre la comprensión de los tipos", 1985 .
  46. Pierce, 2002 , 16. Metateoría de subtipos, p. 225.
  47. Pierce, 2002 , 11.8 Grabaciones, p. 135.
  48. 1 2 3 Minsky traducido por DMK, 2014 , Subtipado y polimorfismo en línea, p. 267-268.
  49. Wand, "Inferencia de tipos para objetos", 1987 .
  50. 1 2 Minsky traducido por DMK, 2014 , Polimorfismo de objetos, p. 255-257.
  51. 1 2 Remy, "Type Inference for Records", 1991 , Trabajo relacionado, p. 3.
  52. 1 2 Remy, "Inferencia de tipos para registros", 1991 .
  53. Blume, "Programación extensible con casos de primera clase", 2006 , p. once.
  54. Remy, "Subtipos y polimorfismo de filas", 1995 .
  55. 1 2 Remy, Vouillon, "Objetivo ML", 1998 .
  56. Pierce, 2002 , 15.8 Observaciones adicionales, p. 223.
  57. Minsky traducido por DMK, 2014 , Variantes polimórficas, p. 149-158.
  58. Pierce, 2002 , 24 Tipos existenciales, p. 404.
  59. 1 2 Reynolds, "Teorías de los lenguajes de programación", 1998 , 18. Especificación del módulo, p. 401-410.
  60. Cardelli, "Programación tipificada", 1991 , 4.4. Tipos de tuplas, pág. 20-23.
  61. 1 2 Harper, Lillibridge, "Enfoque teórico de tipos para módulos de orden superior con uso compartido", 1993 .
  62. 1 2 3 4 Yallop, White, "Polimorfismo ligero de clase superior", 2014 .
  63. Harper, Mitchell, "Estructura tipo de SML", 1993 .
  64. Rossberg, "1ML - Core and Modules United (F-ing First-class Modules)", 2015 , Impredicativity Reloaded, p. 6.
  65. 1 2 Rossberg, "1ML con efectos especiales (polimorfismo de generatividad F-ing)", 2016 .
  66. Ohori, "Método de compilación para cálculos de registros polimórficos", 1992 .
  67. Ohori - SML# (presentación) (enlace descendente) . Consultado el 30 de junio de 2016. Archivado desde el original el 27 de agosto de 2016. 
  68. Ohori, "Cálculo de registros polimórficos y su compilación", 1995 , p. 38.
  69. 1 2 Blume, "Programación extensible con casos de primera clase", 2006 , p. 9.
  70. Ohori, "Cálculo de registros polimórficos y su compilación", 1995 , 5 Implementaion, p. 37.
  71. 1 2 3 4 5 Blume, "Programación extensible con casos de primera clase", 2006 .
  72. Gaster (tesis doctoral), 1998 .
  73. Leijen, "Etiquetas de primera clase", 2004 , p. 7.
  74. Leijen, "Etiquetas de primera clase", 2004 .
  75. Registros extensibles en Haskell-Wiki  (enlace descendente)
  76. Página personal de Blume . Consultado el 30 de junio de 2016. Archivado desde el original el 19 de mayo de 2016.
  77. Blume, "Controladores de excepciones", 2008 .
  78. 1 2 3 Wonseok Chae (tesis doctoral), 2009 .
  79. Paulson, "ML for the Working Programmer", 1996 , 4.6 Declaración de excepciones, p. 135.
  80. Harper, "Fundamentos prácticos para lenguajes de programación", 2012 , 28.3 Tipo de excepción, p. 258-260.
  81. 1 2 Diseño preliminar de ML2000, 1999 .
  82. Harper, "Fundamentos prácticos para lenguajes de programación", 2012 , Capítulo 22. Constructores y tipos, p. 193.
  83. 1 2 3 Weirich et al, "Dar a Haskell un ascenso", 2012 .
  84. Fluet, Pucella, "Tipos fantasma y subtipificación", 2006 .
  85. Pierce, 2002 , 30.5 Yendo más lejos: Tipos dependientes, p. 489-490.
  86. Gifford, Lucassen, "Sistemas de efectos", 1986 .
  87. Lucassen, Gifford, "Sistemas de efectos polimórficos", 1988 .
  88. Talpin, Jouvelot, 1992 .
  89. Harper, Morrisett, "Análisis de tipos intencionales", 1995 .
  90. Crary, Weirich, Morrisett, "Polimorfismo intencional", 1998 .
  91. Pierce, 2002 , 23.2 Variedades de polimorfismo, p. 364-365.
  92. 1 2 Weeks, "Compilación de todo el programa en MLton", 2006 .
  93. 1 2 Hindley, "Esquema de tipo principal", 1969 .
  94. Milner, "Teoría del polimorfismo de tipos", 1978 .
  95. Jones, "FP con sobrecarga y polimorfismo HO", 1995 .
  96. 1 2 3 Kernighan B. , Ritchie D. El lenguaje de programación C = El lenguaje de programación C. - 2ª ed. - Williams , 2007. - S. 304. - ISBN 0-13-110362-8 . , Capítulo 5.11. Punteros de función
  97. Appel, "Crítica de SML", 1992 , p. 5.
  98. Oleg Kiseliov. Listas verdaderamente polimórficas en C . okmij.org. Consultado el 22 de noviembre de 2016. Archivado desde el original el 30 de enero de 2017.
  99. Mitchell, "Conceptos en lenguajes de programación", 2004 , 6.4. Polimorfismo y sobrecarga, pág. 145-151.
  100. Scott Meyers . Inflación de código debido a las plantillas . comp.lang.c++.moderado . Usenet (16 de mayo de 2002). Recuperado: 19 de enero de 2010.
  101. Girard, "Extensión de la teoría de tipos", 1971 .
  102. Girard, "Cálculo de orden superior", 1972 .
  103. Reynolds, "Teoría de la estructura de tipos", 1974 .
  104. Pierce, 2002 , 23.3 Sistema F, p. 365-366.
  105. Milner y otros, "LCF", 1975 .

Literatura

  • Jean-Yves Girard. Une Extension de l'Interpretation de Gödel à l'Analyse, et son Application à l'Elimination des Coupures dans l'Analyse et la Théorie des Types  (francés)  // Actas del Segundo Simposio de Lógica Escandinava. - Ámsterdam, 1971. - Págs. 63-92 . - doi : 10.1016/S0049-237X(08)70843-7 .
  • Jean-Yves Girard. Interprétation fonctionnelle et eliminación des coupures de l'arithmétique d'ordre supérieur  (francés) . — Universidad París 7, 1972.
  • John C. Reynolds. Hacia una teoría de la estructura de tipos // Apuntes de clase en informática . - París: Colloque sur la programmation, 1974. - Vol. 19 . - S. 408-425 . -doi : 10.1007/ 3-540-06859-7_148 .
  • Milner R. , Morris L., Newey M. Una lógica para funciones computables con tipos reflexivos y polimórficos // Arc-et-Senans. — Proc. Conferencia sobre Pruebas y Mejoras de Programas, 1975.
  • Robert Harper . Introducción al aprendizaje automático estándar. - Universidad Carnegie Mellon, 1986. - 97 p. — ISBN PA 15213-3891.
  • Luca Cardelli . Programación tipificada // Informes de Estado del Arte IFIP. - Nueva York: Springer-Verlag, 1991. -Edición. Descripción formal de los conceptos de programación. -431-507.
  • Robert Harper , . Compilación de polimorfismos usando análisis de tipo intencional. — 1995.
  • Lawrence C. Paulson . ML para el programador de trabajo. — 2do. - Cambridge, Gran Bretaña: Cambridge University Press, 1996. - 492 p. -ISBN 0-521-57050-6(tapa dura), 0-521-56543-X (tapa blanda).
  • Benjamín Pierce. Tipos y Lenguajes de Programación . - MIT Press , 2002. - ISBN 0-262-16209-1 .
    • Traducción al ruso: Benjamin Pierce. Tipos en lenguajes de programación. - Dobrosvet , 2012. - 680 p. — ISBN 978-5-7913-0082-9 .
  • Juan C Mitchell Conceptos en lenguajes de programación. - Cambridge University Press, 2004. - ISBN 0-511-04091-1 (eBook en netLibrary); 0-521-78098-5 (tapa dura).
  • Mateo Fluet, Riccardo Pucella. Tipos fantasma y  subtipificación . —JFP , 2006 .
  • Stephanie Weirich, Brent A. Yorgey, Julien Cretin, Simon Peyton Jones, Dimitrios Vytiniotis y Jose P. Magalhães. Dando a Haskell una promoción  // En Actas del 8º Taller ACM SIGPLAN sobre Tipos en Diseño e Implementación de Lenguajes. - NY, USA: TLDI , 2012. - S. 53-66 .
  • Minsky, Madhavapeddy, Hickey. Real World OCaml: Programación funcional para las  masas . - O'Reilly Media, 2013. - 510 p. — ISBN 9781449324766 .
    • Traducción al ruso:
      Minsky, Madhavapeddy, Hickey. Programación en el lenguaje OCaml . - DMK, 2014. - 536 p. - ISBN 978-5-97060-102-0 .