¿Qué hace el modelo?

Veo el término flotando en lo que respecta a PNL y ML en general, y parece que no hay una definición específica.

¿Qué logran los modelos con respecto a PNL y SpaCy?

import spacy
from spacy import displacy

nlp = spacy.load('en_core_web_sm')
doc = nlp(u'This is a sentence.')
displacy.serve(doc, style='dep', options={'compact': True})
1
Jay Jung 15 sep. 2018 a las 07:45

3 respuestas

La mejor respuesta

La guía spaCy 101 tiene una sección sobre esto: consulte aquí:

Si bien algunas de las funciones de spaCy funcionan de forma independiente, otras requieren que se carguen modelos estadísticos, lo que permite que spaCy prediga anotaciones lingüísticas, por ejemplo, si una palabra es un verbo o un sustantivo. spaCy actualmente ofrece modelos estadísticos para 8 idiomas , que se pueden instalar como módulos individuales de Python. Los modelos pueden diferir en tamaño, velocidad, uso de memoria, precisión y los datos que incluyen. El modelo que elija siempre depende de su caso de uso y los textos con los que está trabajando. Para un caso de uso general, los modelos pequeños y predeterminados siempre son un buen comienzo. Por lo general, incluyen los siguientes componentes:

  • Pesos binarios para el etiquetador de parte del discurso, el analizador de dependencias y el reconocedor de entidad con nombre para predecir esas anotaciones en contexto.
  • Entradas léxicas en el vocabulario, es decir, palabras y sus atributos independientes del contexto, como la forma o la ortografía.
  • Vectores de palabras , es decir, representaciones de palabras multidimensionales que le permiten determinar cuán similares son entre sí.
  • Opciones de configuración , como el idioma y la configuración de la canalización de procesamiento, para colocar spaCy en el estado correcto cuando carga el modelo.
5
Ines Montani 15 sep. 2018 a las 10:53

No estoy seguro sobre SpaCy en particular, pero en ML generalmente se refiere al modelo (¿matemático?) De su algoritmo de aprendizaje. De Wikipedia:

[Machine learning] Evolved from the study of pattern recognition and 
computational learning theory in artificial intelligence, machine learning 
explores the study and construction of algorithms that can learn from and make 
predictions on data – such algorithms overcome following strictly static 
program instructions by making data-driven predictions or decisions, through 
building a ***model*** from sample inputs.

Por ejemplo, en redes neuronales, el modelo consistiría en los pesos y las funciones de activación y la forma en que se unen. El modelo es lo que entrena, y cuando se entrena, el modelo hace sus predicciones. Es su programa de ML, o al menos la parte de ML, si lo desea.

0
Emil Vatai 15 sep. 2018 a las 05:02

Spacy no está equipado de forma totalmente independiente con todos los modelos.

Aunque de forma independiente se ocupa de la mayoría de las características, pero sí para los casos de uso que requieren la atención para predecir linguistic annotations, los modelos estadísticos adicionales deben cargarse como módulos individuales.

Supongo que dado que los módulos adicionales se ajustan solo a casos de uso específicos, tal vez es por eso que el equipo de spacy decidió no mantenerse al día con los módulos auxiliares de spaCy.

0
Vikas Yadav 15 sep. 2018 a las 11:02