Antes de abordar sobre los agentes de búsqueda online debemos tener en claro que son los agentes de búsqueda offline para saber diferenciar unos de otros.
En contraste un agente de búsqueda online funciona intercalando el cálculo y la acción: primero toma una acción, entonces observa el entorno y calcula la siguiente acción.
Un agente de búsqueda offline son aquellos que calculan una solución completa antes de poner un pie en el mundo real y luego ejecutan la acción sin recurrir a sus percepciones.
La búsqueda online es una idea necesaria para un problema de exploración, donde los estados y las acciones son desconocidos por el agente; un agente en este estado de ignorancia debe usar sus acciones como experimentos para determinar qué hacer después, y a partir de ahí debe intercalar el cálculo y la acción.
- Problemas de búsqueda online
- Asumimos que el agente sabe:
- Acción (s): Devuelve una lista de acciones permitidas en el estado s.
- Funciones de coste individual c(s,a,s’)
- Test-objetivo
- Asumimos
- El agente no puede tener acceso a los sucesores de un estado, excepto si intenta todas las acciones en ese estado.
- El agente, puede reconocer siempre un estado que ha visitado anteriormente.
- Las acciones son deterministas
- El agente podría tener acceso a una función heurística admisible h(s) que estime la distancia del estado actual a un estado objetivo.
OBJETIVO DEL AGENTE:
- Alcanzar un estado objetivo minimizando el coste
- Conceptos:
- Alcanzar un estado objetivo minimizando el coste.
- Costos. Coste total del camino por el que el agente viaja.
- Proporción competitiva: Obtener el coste más pequeño que sea posible.
- Argumento de adversario.
Asumimos que el espacio de estados es seguramente explorable: algún estado objetivo es alcanzable desde cualquier alcanzable.
- Agentes de Búsqueda Online
- Búsqueda Online en Entornos Desconocidos
- Tipos de Buscadores:
- Directorios
- Meta buscadores
- Agentes de Búsqueda
- Buscadores Personalizados
- Buscadores Especializados y Temáticos
- Agentes de Internet
- Tipos de Agentes
- Agentes de Búsqueda
- Agentes Web
- Bots de Compra
- Bots de Entretenimiento
- Mapeadores
MODELO DEL GENERADOR DE DIALOGOS INTERACTIVOS EN LENGUAJE NATURAL
Búsquedas Inteligentes Online que utilizan Retroalimentación en Lenguaje Natural
Búsqueda Local en Línea (On Line)
Así como en la Búsqueda Primero en Profundidad, La Búsqueda Local Online tiene la propiedad de expandir o buscar hasta el nodo más profundo del árbol de búsqueda. Desafortunadamente, no es muy útil en su forma más simple porque deja al agente que se sitúe en sus últimos nodos con ningún movimiento que hacer.
En vez de reinicios aleatorios, podemos considerar el uso de un camino aleatorio para explorar el entorno. Un camino aleatorio selecciona simplemente al azar una de las acciones disponibles del estado actual; se puede dar preferencia a las acciones que todavía no se han intentado.
Es fácil probar que un camino aleatorio encontrara al final un objetivo o terminar su exploración, a condición de que el espacio sea finito. Por otra parte el proceso puede ser muy lento
Un ejemplo destacado es el agente llamado aprendiendo A en tiempo Real. En la sección(a) el agente parece estar estancado en un mínimo local plano en el estado sombreado. Más que permanecer donde está, el agente debe seguir donde parece ser la mejor trayectoria del objetivo, basada en las estimaciones de los costes actuales para sus vecinos.
El AGENTE-AA TR escoge una acción según los valores de los estados vecinos, que se actualizan conforme el agente se mueve sobre el espacio de estados.
En este caso, el agente AA*TR garantiza encontrar un objeto en un entorno seguramente explorable y finito. Es solo uno de una gran familia de agentes online que pueden definirse especificando la regla de la selección de la acción y que actualiza la regla de manera diferente.
Aprendizaje en la Búsqueda en línea
Una de las cualidades de este tipo de aprendizaje es que el agente presenta ignorancia al inicio de la búsqueda online y esto brinda muchas oportunidades para aprender.
Primero los agentes con la experiencia aprenden un mapa de su entorno mediante el resultado de cada acción en cada estado, para ello registran cada una de sus experiencias, esto se basa en que una experiencia es suficiente para cada acción.
Segundo los agentes de búsqueda locales al usar las reglas de actualización local como en AA*TR obtienen estimaciones más exactas del valor de cada estado, y estas actualizaciones finalmente se unirán en valores exactos para cada estado y esto se logra cuando el agente explora el espacio de estados de manera correcta.
Tercero Cuando ya se conocen los valores exactos, es posible tomar las decisiones optimas simplemente moviéndose al sucesor con el valor más alto.
Cuarto, lo que se pretende es que el agente aprenda que Arriba aumenta la coordenada y a menos que haya una pared en el camino, que hacia Abajo la reduce, etc.
Y por último, para que esto ocurra se necesita una representación formal y manipulable para estas clases de reglas generales y segundo se necesitan algoritmos que puedan construir reglas generales adecuadas a partir de la observación especifica hecha por el agente.
Conclusiones
Los problemas de exploración surgen cuando el agente no tiene la menor idea acerca de los estados y acciones de su entorno. Para entornos seguramente explorables, los agentes de búsqueda en línea pueden construir un mapa y encontrar el objetivo si existe.
Las estimaciones de las heurística, que se actualizaría por la experiencia, proporcionan un método efectivo para escapar de mínimos locales.
Un problema de búsqueda online puede resolverse solamente por un agente que ejecuta acciones, más que por un proceso computacional.
Típicamente el objetivo del agente es alcanzar un estado objetivo minimizando el coste, (El costo es el costo total del camino por el que el agente viaja realmente)