Artículo

Automatización de tareas en sitios web: scraping, clicks y más

Windows, Linux, Mac OSX
Grabado:
26 julio 2019
Website actions to be automated

La Automatización Robótica de Procesos (RPA) está revolucionando la forma en que se realizan labores rutinarias en todo tipo de organizaciones. Por ejemplo, automatizar tareas web como scraping o clicks en páginas puede ahorrarle mucho tiempo a los empleados. Tiempo que pueden emplear en tareas de mayor valor agregado.

¿Le suena conocido un proceso como el siguiente? 

  1. Iniciar una aplicación web.
  2. Introducir un el nombre de usuario en el campo del nombre de usuario.
  3. Ingresar la contraseña en el campo de la contraseña.
  4. Hacer click en el botón de iniciar sesión.
  5. Dirigirse a la sección de reportes.
  6. Ingresar la fecha actual en el campo de fecha.
  7. Esperar a que se muestren los resultados de todos los informes.
  8. Repetir los siguientes pasos para cada informe:
    1. Hacer clic en el enlace del informe.
    2. Guardar el informe en la carpeta de red.
  9. Cerrar la sesión de la página web.

Hacer esto por un informe puede llevarle cerca de 10 minutos y no parece mucho. ¿Pero qué pasa si tiene que hacer esto semanalmente, diariamente o, incluso, una vez por hora?

El solo hecho de usar un sitio web o una aplicación web como parte integral de un trabajo puede consumir muchas horas laborables. Ya que hoy en día Internet es una parte esencial de cualquier tipo de negocio, poder automatizar la interacción con un sitio web es vital para optimizar procesos. La automatización puede encargarse de tareas importantes (pero rutinarias) como las descriptas y liberar tiempo para llevar adelante otros proyectos.

  • ¿Trabaja para una compañía de bienes raíces y necesita descargar/actualizar listados de propiedades en venta? Automatícelo.
  • ¿Trabaja para un hospital que necesita compartir resultados de laboratorio en tiempo y forma? Automatícelo.
  • ¿Necesita extraer un informe de precios de varios sitios web, convertirlo en un reporte diario y enviarlo por correo electrónico a varios sectores? 

Ejemplos de tareas web que pueden automatizarse de forma fácil

Click en un botón o link de una página

Una de las tareas que más comúnmente se automatiza en sitios web consiste en hacer click en un botón o enlace dentro de una página. El click del botón se utiliza para navegar por un sitio web, confirmar operaciones de ingreso de datos, seleccionar un link a otra página o cancelar la navegación. Podría decirse que el click es una de las operaciones más importantes para una secuencia de navegación manual o automatizada del navegador.

Inicio de sesión automática en un sitio web

Hay muchos sitios que se pueden navegar usando procesos automáticos pero que están protegidos por contraseñas. Los ejemplos incluyen portales bancarios, sitios de proveedores, socios de negocio o un portal de clientes. Al automatizar el inicio de sesión y el proceso de navegación de un sitio web se pueden ahorrar muchas horas de procesamiento manual. Además, las credenciales del sitio quedan protegidas, ya que no se necesitan ingresar manualmente. La solución de Automatización Robótica de Procesos puede almacenar las credenciales, realizar las tareas en la página web y registrar todas las interacciones del sitio para poder cumplir con requisitos de auditorías.

Navegación automática en un sitio web

Navegar por un sitio web para cargar o descargar archivos, así como para ingresar o extraer datos es uno de los usos principales que tiene una herramienta RPA aplicada a web. Acciones como moverse a un control seleccionado, desplazarse hacia abajo en una página o determinar en qué enlaces hacer click, también son procesos que pueden automatizarse. Una vez identificados todos los pasos que se necesita ejecutar, los puede configurar en un su plataforma de automatización para que las repita todos los días, todas las veces que se lo necesite.

Esperar a que una página cargue

Cuando se navega automáticamente por una aplicación o página web, la automatización dependerá del tiempo de respuesta de la aplicación web y la velocidad de conexión a Internet. Un buen proceso debe ser capaz de esperar hasta que la página se haya cargado por completo antes de continuar y recién ahí, continuar el curso de la automatización.

Autocompletar formularios web

Esta es una excelente tarea que puede automatizar para ahorrar muchas horas de trabajo manual. Los datos de origen pueden provenir de otra pantalla de la misma aplicación o leerse desde una base de datos, archivo Excel o archivo CSV. Tras ello, puede ingresar automáticamente en un formulario online y enviar la información apretando un botón de forma automática. Esta función también se puede usar para testear los tiempos de respuesta de un formulario en línea, y realizar testeos en la etapa de QA de un nuevo software o sitio web.

Abrir/cerrar una pestaña o ventana del navegador

Cuando se ejecuta una tarea de automatización del navegador, el controlador de la ventana actual puede manejar la ventana o pestaña que está actualmente abierta. La ventana se puede minimizar, maximizar o llevar a primer plano según sea necesario. O, tal vez, la ventana necesita estar en un lugar determinado, como podría ser, por ejemplo, la esquina superior izquierda de la pantalla, y también debe tener un tamaño específico. Siempre es conveniente guardar los atributos de la ventana del navegador web, para usarlos más adelante en otras tareas.

Scraping: extraer datos de una página web de forma automática

Cuando se ingresan datos o se realiza una búsqueda de datos, a menudo es necesario extraer los resultados de la página web o descargar un archivo, para almacenarlo o importarlo en otro proceso, carpeta de red o sistema de gestión de documentos. El proceso en general consiste en inspeccionar la página y obtener el valor deseado de cierto objeto en esa página. Una vez que se obtiene el valor buscado, éste se puede almacenar para su uso posterior. Los valores pueden ser una etiqueta HTML, texto o valor de campo, un hipervínculo a un archivo, o cualquier otro atributo específico que deba ser usado durante el proceso. Los valores se pueden almacenar en un archivo de base de datos, archivo Excel, archivo CSV u otro documento.

La inspección del código HTML de una página también es otra forma muy útil de extraer datos de una página web. Una vez que se ha actualizado una página, puede inspeccionar el código HTML completo o elementos seleccionados, para asegurar que los datos necesarios estén disponibles y la automatización se pueda continuar ejecutando según lo programado.

¿Pero cómo puede automatizar el click de un botón o la escritura de un nombre de usuario en una página web? La forma tradicional de hacerlo sería mediante un script como el siguiente:

coding for automating a click of a button

Este es un ejemplo de un script VB.NET para automatizar una acción de inicio de sesión en Gmail. No parece demasiado complejo, pero tampoco es simple. Especialmente si esto significa aprender a programar en cierto lenguaje, o si el usuario no es de un perfil técnico.

Por suerte hay una forma mucho más sencilla de automatizar tareas web: usando las funciones de automatización de navegador web de Automate.

 Automate Plus: acciones para tareas de navegador web

Before we go into the details of Automate’s web browser action, let’s look at how Automate Plus automates a gmail login:

Coding for automating email login by Automate Plus

Todo lo que se necesita para completar una tarea de inicio de sesión en Gmail con Automate son estos cuatro pasos y menos de cinco minutos. Los pasos se muestran en un lenguaje claro y todo se realiza mediante una interfaz drag-and-drop, por lo que no necesita saber nada de programación. Para quienes estén preocupados por la Seguridad de la contraseña, tienen también la opción de ocultarla o proteger todas las tareas de Automate con contraseña.

Las acciones de navegador web de Automate fueron diseñadas para ser compatibles con los navegadores web más usados como Internet Explorer, Chrome, Safari y Mozilla Firefox, así como para realizar diferentes tipos de interacciones con sitios web.

Automate Plus ofrece una suite completa de automatización de tareas de navegador web, desde hacer click en un botón, hacer scraping automático o extraer datos de una tabla en una página web:

Tarea web

Descripción

Click

Click en un control determinado en una sesión de navegador web

Cerrar

Cierra un navegador web y cierra una sesión creada por la actividad abierta.

Extraer Código

Extrae código HTML y pone los resultados en una variable.

Extraer Tabla

Extrae los contenidos de una tabla determinada en una sesión.

Obtener valor

Obtiene el valor de una elemento determinado en una sesión establecida de navegador.

Abrir

Abre un navegador web y establece una sesión para asociarlo con otras actividades de navegador.

Establecer valor

Establece un valor especificado en otro elemento en una sesión de navegador web determinada.

Navegar

Navega a una URL de una página específica que esté abierta.

Esperar

Espera hasta que el navegador está listo para continuar con la próxima tarea programada en el flujo de trabajo.

A diferencia del método tradicional de seleccionar un elemento en una página a partir de las coordenadas XY (que puede fallar si varía el tamaño o resolución de la ventana), Automate accede a los elementos de una página web a través del código HTML y los interpreta. Un elemento puede ser cualquier cosa que se encuentre en un sitio web: un botón, un cuadro de texto, un enlace, una tabla, etc. Así, al automatizar las interacciones web no tiene que preocuparse por la variación del tamaño o la resolución de la ventana, Automate siempre encontrará el elemento que necesita mediante ese identificador único.

Conozca Automate más a fondo

Automate es un software de RPA que incluye más de 600 acciones predeterminadas, para que pueda automatizar todos los procesos que mencionamos en este artículo y muchos más. Como puede ver en la imagen debajo, puede extraer rápidamente datos de una tabla HTML, completar una hoja de Excel y cargar la información en un sitio FTP. Y todo esto, en solo unos pocos clicks. Para conocer más ejemplos de uso de Automate, lo invitamos a ver este webinar sobre data y web scraping.  

flowchart of business process automation

Automate es una plataforma de RPA que extiende la Automatización de Procesos de Negocio a todas las áreas de una organización. Puede que en su empresa le hayan solicitado ayuda al equipo de IT para automatizar alguna tarea solo para un departamento en particular, pero lo más probable es que con algunos pocos ajustes, los mismos procesos pueden usarse para Marketing, Ventas, Recursos Humanos y más. Además, al no necesitar saber código de programación, la automatización no tiene límites: casi cualquier proceso empresarial o de IT se puede automatizar con Automate.

Comience a usar Automate hoy mismo

Descubra cómo puede automatizar fácilmente tareas web como clicks, scraping y más con Automate de forma fácil y rápida.