Por favor, use este identificador para citar o enlazar este ítem: https://dspace.uces.edu.ar/jspui/handle/123456789/968
Título : Modelado de la mimetización entre interlocutores para mejorar la naturalidad de sistemas de diálogo hablado
Otros títulos : Mimicking the interlocutor's speech: Models of speaker entrainment for improving the nat uralness of spoken dialogue systems
Autor : Gravano, Agustín
Palabras clave : Psicología
Subjetividad
Habla
Diálogo
Prosodia
Fecha de publicación : dic-2010
Editorial : Universidad de Ciencias Empresariales y Sociales (UCES)
Citación : Gravano, A. (2010). Modelado de la mimetización entre interlocutores para mejorar la naturalidad de sistemas de diálogo hablado. Subjetividad y procesos cognitivos, 14(2), 79-88.
Resumen : A medida que las tecnologías de procesamiento del habla continúan mejorando, gradualmente nos acercamos al viejo sueño de crear una máquina que hable. Los actuales sistemas interactivos de diálogo hablado permiten que los usuarios realicen tareas simples, tales como transacciones bancarias y reservas en hoteles, mediante la interacción verbal. Pese a ser relativamente exitosas, estas conversaciones humano-computadora aún tienen un largo camino para recorrer en cuanto a su naturalidad: estos sistemas tienden a ser descriptos por los usuarios como “extraños” o incluso “intimidantes”. Entre las razones principales para esta falta de naturalidad, figura el modelado imperfecto de la variación prosódica, o cómo algunas propiedades del habla (tales como la entonación, la intensidad o el ritmo) cambian en las expresiones verbales. Los sistemas actuales todavía son incapaces de manejar estas características en forma correcta, tanto al entender el habla del usuario como para producir respuestas sintetizadas. La variación prosódica es extremadamente compleja en el habla espontánea, y se sabe que la afectan varios niveles de representación lingüística (léxica, sintáctica, semántica y pragmática). En el presente artículo, enfocamos nuestra atención en una dimensión particular de variación prosódica, conocida como “mimetización entre interlocutores”, que consiste en la alineación automática de características del habla entre los participantes de un diálogo. Tras un repaso general de la literatura de estos temas, describimos un proyecto de investigación en curso que busca modelar la mimetización prosódica en diálogos.
As speech processing technologies continue to improve, the old dream of creating a machine that talks gradually becomes real. The present interactive speech systems enable users to perform simple tasks such as banking transactions and hotel reservations, through verbal interaction. Despite being relatively successful, these human-computer conversations still have a long way to go regarding their naturalness: these systems tend to be described as “odd” or even “intimidating” by users. Among the main reasons for this lack of naturalness, is the flawed modeling of prosodic variation or the way some properties of speech (such as intonation, intensity and rhythm) change in verbal expressions. Current systems are still unable to handle these features correctly, both to understand the speech of the user as to produce synthesized responses. Prosodic variation is extremely complex in spontaneous speech, and it is well known that it´s affected by several levels of linguistic representation (lexical, syntactic, semantic and pragmatic). The present article focuses on a specific dimension of prosodic variation, known as “mimetization between interlocutors”, which consists in the automatic alignment of speech features between the participants of a dialogue. After a general overview of the literature on these subjects, a research project in process that seeks to model the prosodic mimetizatin in dialogues is described.
URI : https://dspace.uces.edu.ar/jspui/handle/123456789/968
ISSN : 1666-244X
Aparece en las colecciones: 2010, v.14, n.2. Herramientas informáticas y análisis del discurso

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Modelado_Gravano.pdf320.25 kBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons