====== Examen Parcial - 75.50. Introduccion a los Sistemas Inteligentes - 05/10/2009 ====== **Cátedra:** G.Martinez - Ochoa \\ **Fecha:** Primer Parcialito - Segundo Cuatrimestre 2009\\ **Día:** 05/10/2009 \\ **Tema:** 1 \\ **Temas:** CRISP-DM, Redes Neuronales y Algoritmos Geneticos \\ **Nota de aprobacion:** Cada tema se evalua y recupera por separado \\ Esta página está incompleta, no recuerdo todas las preguntas. Si te acordas mas, agregalas. Las resoluciones las saque de apuntes y algunas las inventé yo. No son de fiar, si te parece que alguna está mal, corregila. ===== Enunciado ===== ==== Parcialito: Redes Neuronales ==== == Punto I == Explicar que es una capa en una Red Neuronal == Punto II == Explicar que es aprendizaje Supervisado (al otro tema le tocaba No Supervisado) == Punto III == Describir una aplicacion que use una red neuronal BackPropagation (no mas de 5 renglones) ==== Parcialito: Algoritmos Geneticos ==== == Punto I == Explicar que es convergencia prematura de un AG == Punto II == Explicar la finalidad que tiene aplicar Mutacion == Punto III == Cruza. Explicar las distintas formas de Cruza que conozca ==== Parcialito: CRISP-DM ==== == Punto I == Enumerar todas las salidas de la etapa de "Comprension de los Datos" y explicar brevemente 2 de ellas. == Punto II == ¿A que etapa pertenece la salida "Plan de Proyecto"? \\ a. Comprension del Negocio \\ b. Comprension de los Datos \\ c. Preparacion de los Datos \\ d. Modelado \\ e. Evaluacion \\ f. Despliegue \\ == Punto III == A que fase pertenece la actividad FODA? Describa brevemente en que consiste. \\ a. Comprension estatica del negocio \\ b. Evaluacion de los Objetivos del Negocio \\ c. Medios, Expectativas y Restriccion para alcanzar los Objetivos \\ == Punto IV == Dibujar la fase de "Comprension Estatica del Negocio" (usar los nombres correctamente) ===== Resolución ===== ==== Parcialito: Redes Neuronales ==== == Punto I == Las neuronas se ubican en capas (de entrada, Ocultas y de salida). Se dice que una red es totalmente conectada si todas las salidas de un nivel llegan a todos los nodos del nivel siguiente. == Punto II == Los criterios aplicados para el aprendizaje se denominan regla de aprendizaje. Existen reglas que responden a un aprendizaje supervisado y otras a uno no supervisado. Otro criterio sería el aprendizaje on line y off line (fase de aprendizaje y luego pruebas). Las redes con aprendizaje supervisado pueden dividirse en: Aprendizaje por corrección de errores, por refuerzo y estocásticos. Por corrección de errores es off-line y lo que hace es ajustar los pesos de la red en función de la diferencia entre la salida real y la esperada. Un ejemplo de esta red es el Perceptrón, pero este último solo evalúa errores locales. Se han desarrollado nuevos algoritmos para contemplar el error medio. En aprendizaje por refuerzo mas que un tutor existe un crítico que evalúa 1 o –1 en función de éxito o fracaso de la salida. Es un aprendizaje on line. En el aprendizaje estocástico se introducen cambios aleatorios en los pesos de las conexiones y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidades. Es off line. Las redes con aprendizaje no supervisado no requieren influencia externa para modificar el peso de sus conexiones. Existen dos tipos, el aprendizaje Hebbiano y el aprendizaje Competitivo y Cooperativo. En el aprendizaje Hebbiano se ajustan los pesos de las conexiones de acuerdo con la correlación de los valores de activación de las neuronas conectadas. En el competitivo y cooperativo las neuronas compiten y cooperan para llevar a cabo una tarea. El objetivo es categorizar los datos que se introducen en la red. De esta forma, las informaciones similares se clasifican formando parte de la misma categoría y activan la misma neurona de salida. == Punto III == Ejemplos de aplicaciones: reconocimiento de texto, reconociemiento de voz, etc ==== Parcialito: Algoritmos Geneticos ==== == Punto I == Es cuando el algoritmo converge hacia un minimo/maximo local en las generaciones tempranas. == Punto II == Como la selección produce un sesgo en la búsqueda que produce la cruza se introduce la mutación. Esta garantiza la diversidad. Introduce una o mas variaciones en las características de algunos individuos.La probabilidad de mutación es baja y puede ser constante o adaptativa. La mutación asegura que ningún alelo se pierda para siempre de la población.\\ 1.Mutación Simple\\ Se elige un gen al azar y se lo cambia. La probabilidad de mutación es constante y muy baja. Como la probabilidad no es adecuada en todo momento, el operador de mutación no es bien explotado.\\ 2.Mutación Adaptativa por Convergencia\\ La probabilidad de mutar cambia en función de que tan homogenea sea la población. Se basa en históricos.\\ 3.Mutación Adaptativa por Temperatura\\ No se basa en la población. Existen dos casos:\\ Mutación Adaptativa por Temperatura Ascendente:\\ La probabilidad aumenta en cada generación para garantizar una alta diversidad en las últimas generaciones donde la población tiende a ser homogénea. Hay que definir cota máxima para que no se destruyan individuos aptos y que la población nunca converja.\\ Mutación Adaptativa por Temperatura Descendente:\\ Comienza con alta probabilidad y va decreciendo. Contribuye a una exploración mas alta en las primeras generaciones para eliminar la convergencia prematura. Esta probabilidad desciende hasta una cota mínima.\\ == Punto III == 1.Cruza Simple\\ Se elige al azar uno de los l-1 puntos posibles y se intercambian los segmentos de cromosoma separados por este punto.\\ 2.Cruza Multipunto\\ Se considera al cromosoma un anillo y se eligen n puntos de cruza en forma aleatoria. Si n es par se intercambian posiciones, si es impar se asume un punto de cruza adicional en la posición cero.\\ La cruza simple es una multipunto con n=1.\\ 3.Cruza Binomial\\ En esta cruza, posibilidad de que el alelo se herede del padre es P0 y de la madre es 1-P0.\\ Se construye un único hijo por cruza o se crea un hermano que es el complemento. Cuando P0 es 0,5 se denomina cruza uniforme. ==== Parcialito: CRISP-DM ==== == Punto I == * Informe de Coleccion de Datos Inicial \\ * Informe de Descripcion de Datos \\ * Informe de Exploracion de Datos \\ * Informe de Calidad de los Datos \\ Aca estan las explicaciones de todos: [[http://www.dataprix.com/comprensi%C3%B3n-de-datos|Metodologia CRISP en Español]] == Punto II == a. Comprension del Negocio \\ == Punto III == b. Evaluacion de los Objetivos del Negocio \\ FODA es una fotografia actual de la organizacion o un area de la misma == Punto IV == El diagrama es muy simple, en el centro va "Organizacion" y alrededor van "Servicios", "Competencia", "Mision", "Cliente" y "Glosario", todas estas como si fuesen clases (de un diagrama de clases). Todas las flechas salen de Organizacion hacia los otros (y ninguno de los otros estan conectados entre si)