WWDC 2024: Apple se pone al dIA
Fue a finales de marzo cuando Apple confirmó las fechas de la WWDC 2024 y, claro, desde entonces hemos sido muchos quienes hemos estado pendientes de la cuenta atrás hasta que la convención anual para desarrolladores de la tecnológica diera comienzo. Y es que, aunque muchos de los que esperábamos no somos desarrolladores, el evento inaugural de este año apuntaba a ser especialmente interesante para todos los interesados en la inteligencia artificial o, para ser más exactos, en la llegada de la misma al ecosistema de los de Cupertino.
Salvo algunas señales de que, efectivamente, la IA iba a tener bastante relevancia en esta keynote, Apple no había soltado prenda sobre lo que nos iban a contar hoy y, como ya es tradicional, eso no ha impedido que rumores y filtraciones nos hayan permitido hacer proyecciones, en algunos casos bastante acertadas, sobre los anuncios del día y, para ser aún más exactos, de las expectativas que podíamos hacernos con respecto a los anuncios relacionados con la inteligencia artificial.
La keynote, grabada (hace ya unos años que Apple renunció a los eventos en directo) ha empezado fuerte, con los protagonistas del evento capitaneados por el siempre «showman» (y lo digo para bien, ojo, creo que tiene un gran talento natural para estos «saraos») Craig Federhigi, saltando desde un avión al Apple Park al ritmo de Kickstart my Heart, de de los míticos Mötley Crüe (con el plus de que, además, la reproducción de la misma ¡se inicia en un iPod!). El descenso de todos ellos se ve controlado, claro, por paracaídas como los que puedes ver en la imagen que abre esta publicación. Esto va en gustos, claro, pero personalmente esta intro me ha encantado, puro rock and roll con un punto de nostalgia que ya me ha puesto de muy buen humor nada más arrancar.
Claro, ese ritmo no es sostenible a lo largo de la hora y cuarenta minutos que ha durado esta presentación inaugural de la WWDC 2024, ni para quienes la han creado y la presentan, ni para toda la potencial audiencia del evento, así que tras ese «pelotazo» de arranque (ojalá siente escuela en el sector) ha llegado el momento de la bienvenida por parte de Tim Cook y, de su mano, arrancar con los anuncios del día. Y, como cabía esperar, pues es costumbre de la casa, la cosa ha ido, más o menos, de menos a más. Es decir, que se han reservado lo más importante/esperado para el final.
Pero no te preocupes, que yo no voy a replicar esa técnica, pues seguramente lo que más te interesa saber es qué nos han contado en la WWDC 2024 en relación con la inteligencia artificial. Eso sí, ya te adelanto que, tal y como esperábamos, lo de hoy ha sido una puesta al día para ponerse (más o menos) al nivel de sus principales competidores. No en vano, Federhigi ha calificado (muy acertadamente) lo que hemos visto hoy como el principio de un camino.
Creo que, en este punto y circunstancias, Apple actúa de manera bastante adecuada. Ya he mencionado en anteriores ocasiones que, por las circunstancias que sea, no reaccionaron a tiempo para dar una réplica rápida a sus rivales, de modo que intentar adelantarlos ahora era materialmente imposible. En su lugar, como veremos a continuación, han optado por tomar mucho de lo ya existente y, eso sí, darle el «toque Apple», algo en lo que son expertos en Cupertino.
Apple Intelligence
Hemos podido confirmar, tal y como ya te adelantamos el viernes pasado, que el conjunto de funciones basadas en IA que llegarán próximamente al ecosistema de la compañía se denomina Apple Intelligence. Puede parecer (y en parte lo es, claro) cuestión de branding, pero es cierto que, sin renunciar a la inicial AI (por inteligencia artificial en inglés), comunican desde el primer momento que no es la IA que ya conocemos, que es la visión que ellos tienen de la IA, y esto es importante tanto para la marca como para sus usuarios.
Sí, he dicho que llegarán próximamente, pues las primeras novedades al respecto debutarán, como ya esperábamos, en iOS 18, iPad 18 y macOS 15 (de los que te contamos las novedades en otro artículo), sistemas operativos de los que las betas para desarrolladores estarán disponibles desde hoy mismo, mientras que las públicas llegarán en algún momento de julio. La gran duda es si todas estas funciones estarán disponibles en las mismas desde el primer día.
Por otra parte, seguramente te estarás preguntando a qué dispositivos llegarán las funciones presentadas en esta keynote inaugural de la WWDC 2024 y, a este respecto, las noticias son mejores para los usuarios actuales de ordenadores Mac y de iPad Pro, que de dispositivos iPad, iPad Air y iPhone, pues el punto de corte lo ponen los SoC. Los chips compatibles son los Apple A17 Pro, por lo que solo los iPhone 15 Pro y 15 Pro Max podrán disfrutarlas. ¿Y en cuanto a ordenadores y tablets? Cualquier chip de la familia Apple Silicon, desde su primera generación (M1) tienen la puerta abierta a Apple Intelligence.
Antes de entrar a contar las novedades que han mostrado es importante, eso sí, poner el foco en un aspecto importante y que, por lo contado en el párrafo anterior, podría no resultar especialmente obvio. Y es que Apple no ha optado por un modelo de IA 100% en el cliente. En su lugar, el sistema operativo analizará cada una de las tareas basadas en IA que vamos a emplear y, en función de la capacidad de cómputo necesaria, las llevará a cabo en local o recurrirá a la nube.
Eso sí, y este es uno de los puntos en los que entra la applelificación, Apple ha creado lo que denomina Private Cloud Compute (computación privada en la nube) que, como ya puedes deducir por su nombre, pretende llevar la privacidad propia de la IA en el dispositivo a la nube, garantizando la misma privacidad para los datos. Y es que, según nos han contado en esta WWDC 2024, ni Apple ni terceras partes podrán tener acceso a los datos que subimos y, claro, tampoco serán empleados para entrenar sus modelos.
Esto puede generar dudas y suspicacias, por lo que han confirmado que su compromiso con la privacidad de los usuarios es auditable. Y aunque ya sabemos cómo se las suelen gastar las tecnológicas en este sentido, personalmente sí que me siento bastante propenso a darle total credibilidad a este compromiso. Distinta cosa es, claro, que la seguridad de dichos servicios se pueda ver comprometida por terceros, pero apuesto a que Apple ha puesto bastante cuidado en este punto.
Desde finales del año pasado se han ido filtrando funciones que, en principio, iban a ser presentadas hoy. Sin embargo, al comparar dichas listas con lo que finalmente se ha mostrado en la keynote inaugural de la WWDC 2024 no hemos podido poner un check en todas las casillas. Ahora bien, todavía queda tiempo desde hoy hasta que lleguen las versiones finales de iOS y iPadOS 18, así como de macOS 15, por lo que es posible que algunas se sumen en los próximos meses, y también que veamos llegar otras más adelante, en las actualizaciones de los mismos.
Esto no significa, ojo, que lo de hoy en la WWDC 2024 haya sido poca cosa. Parece que Apple ha preferido centrarse en una selección de funciones y, eso sí, poner el foco en la personalización de las mismas. Y es que este es un punto en el que han puesto el foco varias veces, en la sensibilidad de Apple Intelligence al contexto, siendo el contexto en este caso el propio usuario y sus datos. Para tal fin, el sistema operativo crea y mantiene al día un índice semántico personalizado, que será empleado por las funciones para proporcionar un resultado a medida.
Así pues, y como verás a continuación, en el repaso de las novedades anunciadas hoy, casi la totalidad de las mismas ya las hemos visto previamente en otras plataformas. Le damos un repaso a las más importantes:
Escritura
- Reescritura: te permite seleccionar un texto que ha escrito previamente para cambiar su tono en función de a quién vaya dirigido.
- Corrección: revisa ortografñia, gramática, la elección de palabras y la estructura de las oraciones, sugiriendo posibles mejoras con explicaciones.
- Resumen: permite resumir textos seleccionados en forma de párrafo, puntos clave, tabla o lista.
Correo
- Mensajes prioritarios: muestra los correos electrónicos más urgentes en la parte superior de la bandeja de entrada.
- Resúmenes de correo electrónico: en lugar de mostrar las primeras líneas de cada correo electrónico, se muestran resúmenes que nos permiten conocer su contenido sin necesidad de abrir el mensaje.
- Respuesta inteligente: ofrece sugerencias para una respuesta rápida e identifica preguntas, cuyas posibles respuestas también serán sugeridas, en un correo electrónico, para asegurarse de que se responde a todo.
Notificaciones
- Notificaciones prioritarias: aparecen en la parte superior para destacar lo más importante.
- Resúmenes de notificaciones: de nuevo una función de resumen, tan práctica en estos tiempos. En este caso, cambiaremos la enorme pila de notificaciones por resúmenes que nos permitirán ponernos al día mucho más rápido y de una manera más cómoda.
Notas y teléfono
- Transcripción y resumen de audio: los usuarios podrán grabar, transcribir y resumir audio en las aplicaciones Notas y Teléfono. Eso sí, el sistema informará automáticamente a los participantes cuando se inicia una grabación durante una llamada. Al finalizar la misma, Apple Intelligence nos proporcionará un resumen.
Imágenes
- Image Playground: permite crear imágenes a demanda, tal y como ya hemos visto en otros modelos. Eso sí, en este caso los estilos se limitan a tres: animación, ilustración y boceto. Se integra en aplicaciones como Mensajes y está disponible como aplicación independiente.
- Image Wand en Notas: permite a los usuarios convertir bocetos en imágenes y crear imágenes a partir de espacios vacíos utilizando el contexto del área circundante. En el ejemplo mostrado por Apple, hemos podido ver un documento dedicado a la arquitectura india en el que, al invocar esta función, se ha generado una imagen totalmente adaptada al texto.
- Genmoji: seguramente ya lo has deducido, hablamos de generación mediante IA de emojis, que podremos crear mediante descripciones o, y esto me ha parecido especialmente divertido, combinando éstas con fotos de tus amigos y familiares.
Fotos
- Búsqueda por lenguaje natural: permite buscar fotos específicas utilizando lenguaje natural, para lo que se apoya en el índice semántico que mencioné anteriormente. De este modo, podrás realizar búsquedas como «Vacaciones en la playa con Paloma» y el sistema identificará a qué persona te refieres, y seleccionará todas las fotos de tu galería de viajes que hayas hecho con esa persona a la playa.
- Búsqueda en vídeos: permite encontrar, también mediante búsquedas con lenguaje natural, momentos específicos en los vídeos.
- Herramienta de limpieza: identifica y elimina objetos que distraen en el fondo de una foto sin alterar el sujeto. También permite seleccionar, manualmente, qué deseas borrar, y que ese espacio se cubra con relleno generativo.
- Recuerdos: permite crear historias a partir de fotos y vídeos utilizando una descripción. Apple Intelligence selecciona el contenido adecuado, crea una historia con capítulos basados en temas y la organiza en una película con su propia narrativa. No obstante, también te permite realizar ajustes y elegir la banda sonora en función de tus preferencias.
La esperada evolución de Siri
Esperada, esperadísima, era la renovación de Siri, el asistente digital de los sistemas operativos de Apple. Y es que, como ya he recordado en otras ocasiones, Apple fue la precursora de este tipo de asistentes basados en inteligencia artificial, con su presentación y lanzamiento hace ya 13 años (debutó en 2011). El problema es que, tras situarse en la vanguardia absoluta, durante todos estos años hemos visto muy poca evolución, lo que ha permitido que los últimos años sus principales rivales hayan podido sacarle ventaja.
Así, teníamos bastante claro que uno de los anuncios más relevantes de la keynote inaugural de la WWDC 2024 sería todo lo que se circunscribe al asistente digital. Ahora bien, y antes de entrar a revisar las novedades, tengo una mala pero previsible noticia, y es que estas funciones, inicialmente, solo estarán disponibles para los usuarios de los sistemas operativos en inglés. Han adelantado, claro, que alcanzará otros idiomas más adelante, quizá a finales de este mismo año, más probablemente durante el año que viene.
Lo primero, por llamativo, es que Apple ha reformulado la interfaz de Siri, que cambia el tradicional disco de colores que se muestran en la parte baja de la pantalla, por un borde de colores suaves que rodea todo el contenido de la pantalla para indicar que el asistente está activo. Y, en lo referido a su interfaz, otra novedad importante es que, con esta actualización, podremos seguir utilizando Siri con comandos de voz, pero ahora también será posible realizar peticiones mediante texto.
Una novedad clave de Siri es que mejora sustancialmente su capacidad de interpretar lenguaje natural, lo que se traduce no solo en unas interacciones más cómodas (lo de hablar en «modo robot» cada vez va quedando más lejos en el tiempo). Pero esta no es la única ventaja de esta evolución, y es que gracias a su mayor capacidad de comprensión, podremos formular peticiones más complejas (un poco más adelante, al revisar el resto de novedades, lo explico con algunos ejemplos).
Adicionalmente, hoy en la WWDC 2024 también nos han contado que Siri será muchísimo más sensible al contexto, tanto al general del usuario como al específico del momento. ¿Qué quiero decir con esto? Pues, en lo referido al primer punto, que volvemos a hablar del índice semántico que tan importante resulta en el contexto de Apple Intelligence. Y, con el segundo punto, me refiero a que ahora Siri será consciente del contenido que se está mostrando en pantalla en el momento de la interacción, por lo que podremos realizar consultas y peticiones en relación con el mismo.
Así, esto son algunos ejemplos de lo que podremos pedirle a Siri:
- ¿A qué hora llega el vuelo de mi madre?
- ¿Qué libro me recomendó mi hermana la semana pasada?
- Quiero ver una foto mía con una camisa naranja.
- Muéstrame los archivos que añadí en junio.
ChatGPT
Algo que se ha venido rumoreando las últimas semanas era la colaboración entre Apple y OpenAI, se ha visto confirmado, aunque no del modo que esperábamos. Y es que, como puedes ver en la imagen sobre este párrafo, lo que nos han mostrado hoy en la WWDC 2024 es la integración de ChatGPT, en este caso con GPT-4o.
En estos casos, eso sí, el usuario siempre tendrá que confirmar previamente que desea utilizar el chatbot de OpenAI, es decir, que el sistema operativo no recurrirá automáticamente a este chatbot, con lo que esto implica en lo referido a la privacidad del usuario. Muy al contrario, será necesario que lo aceptemos de manera explícita.
Así, en resumen, esto es lo que nos han contado en la keynote inaugural de la WWDC 2024 en lo referido a la inteligencia artificial, un movimiento prudente pero que apunta a ser bastante acertado. Repito lo que decía antes, y es que Craig Federhigi ha afirmado que esto es el principio y que, en los próximos tiempos, veremos la evolución de Apple Intelligence. De momento se han preocupado en completar una primera selección de funciones que prometen estar bastante afinadas, y que además tienen «el toque Apple».
Así, hoy hemos pasado de una Apple que iba muy, muy por detrás, que parecía incapaz de reaccionar, a otra totalmente distinta, que ha dado el primer paso para demostrar que su capacidad de tomar lo ya existente y «darle una vuelta» que convierte su propuesta al respecto en algo único, se mantiene en plena forma. Y como usuario de Apple desde hace décadas, pero no fan, lo que he visto hoy va directamente a la lista de las razones que me hacen seguir concediendo bastante valor a lo que hacen en Cupertino… siempre que lo hagan bien. Claro que, con eso de arrancar la WWDC 2024 con Mötley Crüe y un iPod, ya me tenían medio ganado.