El Foro  

Retroceder   El Foro > Foros Temáticos > Ciencia y Tecnología

Avisos

Respuesta
 
Herramientas Desplegado
  #1  
Antiguo 13-Apr-2020, 15:01
Avatar de JAGM-Georgy
JAGM-Georgy JAGM-Georgy está desconectado
Usuario
 
Fecha de Ingreso: 14-October-2016
Ubicación: Santiago de Chile
Mensajes: 194
Predeterminado (idea) Una máquina que crea cuentos

Esta es una idea que tuve hace mucho, se trata de una aplicación de computadora que tiene todas las combinaciones de textos, y que cuando le escribes las cosas que quieres que tenga con frases y/o palabras, esta solo usa de estas combinaciones solo el texto acerca de estas palabras y frases, creando un cuento al azar. No sé si es posible crear algo así, pero pongo este tema por si alguien se atreve a intentar crearlo. Sería genial tener algo así, imagínense todos los cuentos que la gente podría pedir y leer, siempre sería algo nuevo. Pero como dije, no sé si es posible crear algo así. Espero que esta idea tenga que ver con ciencia y tecnología, pues pensé que tendría que ver, si que espero que esté en el subforo correcto. Espero sus opiniones e ideas.
Responder Citando
  #2  
Antiguo 19-Apr-2020, 08:16
Avatar de doonga
doonga doonga esta en línea ahora
SUPER Usuario
 
Fecha de Ingreso: 07-October-2016
Mensajes: 11.066
Predeterminado

Para qué combinaciones de textos:
Solamente basta que disponga de las 27 letras del abecedario, y de los signos de puntuación, y hagas combinaciones al azar.
El quijote podría salir en algunos miles de millones de intentos (me quedo corto, pero no quiero calcular la probabilidad de que ocurra).

Pero que aparezca la frase "que lindo.", es bastante más probable.
Hay 10 símbolos, cada uno tiene 30 posibilidades ("a"-"z", "." y " ")

O sea hay (10^30) alternativas.
O sea, esa frase de seguro, jamás ocurrirá.

Pero luego puedes establecer ciertas reglas.
Que luego de un "q" siempre viene una "u"
O sea, (10^29) posibilidades.

El ejemplo es algo tonto, pero muestra lo difícil que resulta hacerlo.

Pero luego podemos establecer más reglas,
por ejemplo, que una combinación de letras permitida es un subconjunto que debe aparecer en un diccionario.

Pero el diccionario español tiene alrededor de 400.000 palabras, lo que, naturalmente, achica el universo.

Con la última restricción, la frase "qué lindo" se podría producir en
400.000 * 400.000 intentos, es decir 160.000.000.000 intentos,
lo cual achica aún más el universo.

Luego agregamos reglas sintácticas:
Luego de "que" solamente pueden aparecer un subconjunto de palabras, según su clasificación: verbo, adverbio, intejección....
Así, el programa computacional podría ir "podando" lo que se define como árbol de decisiones.
Si a lo anterior, a cada decisión le agregas una probabilidad

Por ejemplo. después de "ponga atención" hay un 60% de probablidad que aparezca ":"
y 40% que aparezca "!", el árbol de decisiones se achica aún más.

Cuando entramos al punto de que la próxima palabra se puede escoger entre un abanico de posibilidades,
y la siguiente otro abanico, entonces nos estamos acercando
a lo que se define como un sistema experto.

De ahí a los sistemas malamente denominados "inteligentes" hay un paso.

Y si, un sistema experto puede armar frases en base a un sistema de reglas, y armar frases coherentes,
y sistemas como esos se están haciendo más comunes.

Lo interesante en esto, que las probabilidades asignadas a las alternativas de decisión se pueden automodificar: sistemas que aprenden.

El sistema crea una frase, tú la corriges, y, si la corrección se hace un número suficiente de veces,
el sistema "aprende": esto es, "cambia las conexiones", o agrega conexiones.

Basado en esos paradigmas es que se inventaron las "redes neuronales", donde cada "neurona"
recibe un estímulo de un sensor, y se vincula con otra neurona de 2° nivel.

Lo anterior no solamente se utiliza en la generación de textos, sino en el reconocimiento de patrones, y decisiones basadas en ésto.

Un sistema de control de automóviles podría, en lugar de actuar el freno o el acelerador, decirte "frena",
o decirte "frena!!!" o decirte "FRENA ESTÚPIDO",
según lo que sensan los sensores.
__________________
Nunca comprenderás la inmensidad de "La Nada"

Última edición por doonga; 19-Apr-2020 a las 08:20
Responder Citando
  #3  
Antiguo 19-Apr-2020, 08:22
Avatar de EsquizOfelia
EsquizOfelia EsquizOfelia está desconectado
Moderator
 
Fecha de Ingreso: 13-February-2008
Mensajes: 9.782
Predeterminado

Increíble lo que nos cuentas Doonga.
__________________
.

No seamos voceros del terrorismo.
No difundamos sus crímenes.

.
Responder Citando
  #4  
Antiguo 19-Apr-2020, 13:28
Loboesceptico Loboesceptico está desconectado
Usuario PLUS
 
Fecha de Ingreso: 02-April-2018
Ubicación: Paraguay
Mensajes: 372
Predeterminado

La religión
Responder Citando
  #5  
Antiguo 19-Apr-2020, 15:04
Avatar de doonga
doonga doonga esta en línea ahora
SUPER Usuario
 
Fecha de Ingreso: 07-October-2016
Mensajes: 11.066
Predeterminado

Cita:
Iniciado por Loboesceptico Ver Mensaje
La religión
Estoy haciendo un trabajo (una entretención, en realidad), respecto al análisis comparativo de textos escritos en español.

Me pareció adecuado utilizar un libro suficientememnte extenso, y que tuviese traducciones interesadamente sesgadas.

Y qué libro más apropiado que las traducciones de la biblia al español.
Tienen más de 30.000 versículos,
Más de 700.000 palabras, que se reducen a más de 25.000 lexemas (o palabra distintas), y cerca de 7.000 fonemas (o palabras que suenan parecido).

Interesante que una biblia se analiza léxicamente en 3 segundos. Pensé que sería más demorado: en 9 segundos, las tres biblias están leídas, analizadas y memorizadas.

Ahora me encuentro estudiando algunos tópicos de AI, útiles para el análisis y comparación de textos, que se denomina Deep Learning (aprendizaje profundo)

Recién voy en el desarrollo de los andamios, la infraestructura básica, y, en eso, en el análisis léxico y fonético para realizar búsquedas, ya que este es el primer paso necesario para cualquier análisis informático de esta naturaleza.
Para iniciar, he descargado tres versiones en español:

La Reina Valera Antigua, la biblia de Jerusalén, de 1976, y la TNM (traducción el nuevo mundo).

Porqué solamente tres: para el estudio inicial es suficiente.
Porqué esas tres: porque fueron las primeras que encontré listas para la descarga en un formato apto para ser procesado sin mayor obstáculo.

La idea es utilizar una de ellas como pivote (es decir, asumiendo que es la correcta, y las restantes, una desviación), y encontrar las diferencias de las otras respecto a la primera.

Luego utilizar otra como pivote, y finalmente quedar con tres extractos: en qué se diferencian las otras de ésta, para luego comenzar a trabajar sobre los tes extractos.

Bueno, el deep learning se suele utilizar en los análisis llamados "big data", donde hay muchas opiniones sobre pocos tópicos (pocos es un decir).

Aquí el problema es diferente: hay tres opiniones sobre muchos tópicos, lo que significa que se enfrenta un problema diferente, pero semejante en el hecho que los diversos tópicos (versículos, en este caso), deben ser contextualizados, primero internamente, estableciendo una red de afirmaciones (o verdades) internas no contradictorias e internas contradictorias, y luego correlacionar esto con las contradicciones externas.

Las coincidencias no interesan, excepto para un resumen estadístico.

No se vislumbra muy trivial, pero no deja de ser un desafío interesante.

Estoy invocando el espíritu de chomsky, mientras chomsky viva.
__________________
Nunca comprenderás la inmensidad de "La Nada"
Responder Citando
  #6  
Antiguo 19-Apr-2020, 15:32
Avatar de Abysso
Abysso Abysso está desconectado
SUPER Usuario
 
Fecha de Ingreso: 16-August-2019
Ubicación: Uruguay
Mensajes: 3.805
Predeterminado

doonga está metido en algo turbio del bigdata

(es que faltaba petra y tuve que hacerte la respuesta yo)
Responder Citando
  #7  
Antiguo 20-Apr-2020, 20:50
Loboesceptico Loboesceptico está desconectado
Usuario PLUS
 
Fecha de Ingreso: 02-April-2018
Ubicación: Paraguay
Mensajes: 372
Predeterminado

Cita:
Iniciado por doonga Ver Mensaje
Estoy haciendo un trabajo (una entretención, en realidad), respecto al análisis comparativo de textos escritos en español.

Me pareció adecuado utilizar un libro suficientememnte extenso, y que tuviese traducciones interesadamente sesgadas.
.
Alguna vez lei sobre un trabajo que hizo, no recuerdo quién, sobre la biblia.

Uno señalaba el versículo y salia el error, la anacronia o el "robo del derecho de autor" etc.
Responder Citando
  #8  
Antiguo 24-Apr-2020, 18:29
Avatar de Eli_yahu
Eli_yahu Eli_yahu está desconectado
SUPER Usuario
 
Fecha de Ingreso: 17-September-2016
Mensajes: 11.424
Predeterminado

Cita:
Iniciado por doonga Ver Mensaje
Estoy haciendo un trabajo (una entretención, en realidad), respecto al análisis comparativo de textos escritos en español.

Me pareció adecuado utilizar un libro suficientememnte extenso, y que tuviese traducciones interesadamente sesgadas.

Y qué libro más apropiado que las traducciones de la biblia al español.
Tienen más de 30.000 versículos,
Más de 700.000 palabras, que se reducen a más de 25.000 lexemas (o palabra distintas), y cerca de 7.000 fonemas (o palabras que suenan parecido).

Interesante que una biblia se analiza léxicamente en 3 segundos. Pensé que sería más demorado: en 9 segundos, las tres biblias están leídas, analizadas y memorizadas.

Ahora me encuentro estudiando algunos tópicos de AI, útiles para el análisis y comparación de textos, que se denomina Deep Learning (aprendizaje profundo)

Recién voy en el desarrollo de los andamios, la infraestructura básica, y, en eso, en el análisis léxico y fonético para realizar búsquedas, ya que este es el primer paso necesario para cualquier análisis informático de esta naturaleza.
Para iniciar, he descargado tres versiones en español:

La Reina Valera Antigua, la biblia de Jerusalén, de 1976, y la TNM (traducción el nuevo mundo).

Porqué solamente tres: para el estudio inicial es suficiente.
Porqué esas tres: porque fueron las primeras que encontré listas para la descarga en un formato apto para ser procesado sin mayor obstáculo.

La idea es utilizar una de ellas como pivote (es decir, asumiendo que es la correcta, y las restantes, una desviación), y encontrar las diferencias de las otras respecto a la primera.

Luego utilizar otra como pivote, y finalmente quedar con tres extractos: en qué se diferencian las otras de ésta, para luego comenzar a trabajar sobre los tes extractos.

Bueno, el deep learning se suele utilizar en los análisis llamados "big data", donde hay muchas opiniones sobre pocos tópicos (pocos es un decir).

Aquí el problema es diferente: hay tres opiniones sobre muchos tópicos, lo que significa que se enfrenta un problema diferente, pero semejante en el hecho que los diversos tópicos (versículos, en este caso), deben ser contextualizados, primero internamente, estableciendo una red de afirmaciones (o verdades) internas no contradictorias e internas contradictorias, y luego correlacionar esto con las contradicciones externas.

Las coincidencias no interesan, excepto para un resumen estadístico.

No se vislumbra muy trivial, pero no deja de ser un desafío interesante.

Estoy invocando el espíritu de chomsky, mientras chomsky viva.
Me llamó la atención que diste estos detalles sobre el trabajo que estás haciendo. Creo que es interesante.

Una vez me propuse hacer algo parecido pero solo con el libro de Proverbios, porque me pareció útil estudiar la cantidad de calificativos humanos diferentes que este libro bíblico contiene y la extensa combinación que se hace de ellos ahí, y cómo se definen en el mismo libro. Es uno de esos proyectos que tuve que dejar a medias. Pero creo que si hubieras hecho el análisis con una base de datos más pequeña, hubieras tenido un punto de comparación más rápido de realizar para luego abarcar mayor cantidad de texto como es la Biblia completa en dos idiomas (tres para ser exactos) ... donde vas a tener más variables que tener en cuenta.

Solo pasaba y me pareció que mi comentario podría interesarte.
__________________
2Tim.3:13 (...) los hombres inicuos e impostores avanzarán de mal en peor, extraviando y siendo extraviados.
Dan.11:33 Y tocante a los que tienen perspicacia entre el pueblo, impartirán entendimiento a los muchos. (...)
... 12:10 Muchos se limpiarán y se emblanquecerán y serán refinados. Y los inicuos ciertamente actuarán inicuamente, y absolutamente ningún inicuo entenderá; pero los que tengan perspicacia entenderán.


Última edición por Eli_yahu; 24-Apr-2020 a las 18:31
Responder Citando
  #9  
Antiguo 25-Apr-2020, 21:31
Avatar de doonga
doonga doonga esta en línea ahora
SUPER Usuario
 
Fecha de Ingreso: 07-October-2016
Mensajes: 11.066
Predeterminado

Cita:
Iniciado por Eli_yahu Ver Mensaje
Me llamó la atención que diste estos detalles sobre el trabajo que estás haciendo. Creo que es interesante.

Una vez me propuse hacer algo parecido pero solo con el libro de Proverbios, porque me pareció útil estudiar la cantidad de calificativos humanos diferentes que este libro bíblico contiene y la extensa combinación que se hace de ellos ahí, y cómo se definen en el mismo libro. Es uno de esos proyectos que tuve que dejar a medias. Pero creo que si hubieras hecho el análisis con una base de datos más pequeña, hubieras tenido un punto de comparación más rápido de realizar para luego abarcar mayor cantidad de texto como es la Biblia completa en dos idiomas (tres para ser exactos) ... donde vas a tener más variables que tener en cuenta.

Solo pasaba y me pareció que mi comentario podría interesarte.
Buen comentario.
Pero no.
Mientras mayor el tamaño del universo de lo que se procesa, mejor y más fácil lograr una meta.
Si lo haces con papel y lápiz, obvio que no puedes abarcar mucho.
Pero si lo haces con una máquina, no debes abarcar poco.
__________________
Nunca comprenderás la inmensidad de "La Nada"
Responder Citando
  #10  
Antiguo 26-Apr-2020, 10:47
Avatar de Eli_yahu
Eli_yahu Eli_yahu está desconectado
SUPER Usuario
 
Fecha de Ingreso: 17-September-2016
Mensajes: 11.424
Predeterminado

Cita:
Iniciado por doonga Ver Mensaje
Buen comentario.
Pero no.
Mientras mayor el tamaño del universo de lo que se procesa, mejor y más fácil lograr una meta.
Si lo haces con papel y lápiz, obvio que no puedes abarcar mucho.
Pero si lo haces con una máquina, no debes abarcar poco.
No veo la lógica en lo que estás diciendo. "Mejor y más fácil" es usar una base pequeña ... que el resultado sea menos exhaustivo depende de lo que desees extraer de los datos. El ejemplo que puse del libro de Proverbios es un buen ejemplo: en ese libro se mencionan cientos de cualidades humanas y calificativos humanos. Ese libro sería ideal para analizar conceptos hebreos sobre la conducta humana, su definición bíblica y cuándo se pueden aplicar "bíblicamente" esos calificativos, y hasta hacer un intento de definiciones bíblicas sobre muchas cualidades humanas.

En el caso de exégesis teológicas que hacen algunos estudiosos religiosos y seglares, ellos escogen diferentes bases de datos dependiendo de lo que quieren abarcar y describir. No le sirven los evangelios a alguien que quiere estudiar el lenguaje paulino, por ejemplo. No le servirían las cartas de Pablo si lo que desean analizar es la capacidad discursiva de Pedro. No buscarían en los evangelios para hacer una biografía de Pablo, etc.

Ahora, si lo que tú quieres hacer es solamente "comparar" versiones de la Biblia, pues tres no sería suficiente para eso.
__________________
2Tim.3:13 (...) los hombres inicuos e impostores avanzarán de mal en peor, extraviando y siendo extraviados.
Dan.11:33 Y tocante a los que tienen perspicacia entre el pueblo, impartirán entendimiento a los muchos. (...)
... 12:10 Muchos se limpiarán y se emblanquecerán y serán refinados. Y los inicuos ciertamente actuarán inicuamente, y absolutamente ningún inicuo entenderá; pero los que tengan perspicacia entenderán.

Responder Citando
Respuesta

Herramientas
Desplegado

Normas de Publicación
No puedes crear nuevos temas
No puedes responder mensajes
No puedes subir archivos adjuntos
No puedes editar tus mensajes

Los Códigos BB están Activado
Las Caritas están Activado
[IMG] está Activado
El Código HTML está Desactivado

Ir al Foro


La franja horaria es GMT -6. Ahora son las 12:17.


Desarrollado por: vBulletin® Versión 3.8.1
Derechos de Autor ©2000 - 2020, Jelsoft Enterprises Ltd.