El libro de jugadas de software empresarial parecía claro: todo finalmente se movió a la nube. Aplicaciones, bases de datos, almacenamiento: todos siguieron la misma presión inevitable hasta el servicio de servicio de software.
Sin embargo, con la llegada de la inteligencia artificial y el auge, podemos ver una historia diferente, una nube es solo un capítulo que todo el libro.
SAS y Director de Infraestructura en Speechmatics.
Sistema de inteligencia artificial
Las cargas de trabajo de IA son animales fundamentalmente diferentes que las aplicaciones empresariales que definen las ondas de migración en la nube. El software Dition se escala estimadamente, procesa los datos en los lotes y puede soportar algún retraso.
Los sistemas de IA no están determinados, se necesitan mucho procesamiento paralelo y, a menudo, deben responder al tiempo real. Estas diferencias rehapen toda la ecuación económica de dónde y cómo lo impulsa su infraestructura.
Tome el desafío de correr durante mucho tiempo. Los modelos de aprendizaje automático no entrenan en el horario; Proporciona capacitación hasta que se ensamblen. Puede ser horas, día o semana. Los proveedores de la nube son expertos en suministro de infraestructura a corto plazo, pero la capacidad de la GPU en los hiperesalers puede ser difícil de obtener 1 año sin reservas.
El resultado se paga por las capacidades garantizadas que no puede usar completamente, o su trabajo de entrenamiento se ve obstaculizado mientras usa un ejemplo spot para reducir los costos.
Luego está el desafío de adivinar. A diferencia de las aplicaciones web que pueden ver picos de tráfico durante el Black Friday, los servicios de IA deben escalarse constantemente a medida que aumenta el uso del cliente.
Los modelos de precios basados en tokens que operan modelos de idiomas grandes hacen que esta escala sea impredecible de tal manera que lo tradicional no valga el tránsito. Un solo cliente puede consumir 10 tokens o 10,000 dependiendo de las complicaciones de la reacción y el tamaño de la ventana de contexto.
Enfoque híbrido
El desarrollo más atractivo involucra a empresas que descubren enfoques híbridos que reconocen estos requisitos únicos en lugar de abandonar la nube. Están utilizando el estrés laboral estimado y en la estructura de base al tiempo que ganan recursos en la nube para la explosión real de la demanda.
Los usuarios coexisten para aplicaciones sensibles al retraso como la IA de conversación. Están buscando su principal propiedad de infraestructura de su uso específico de los servicios en la nube para examinar más libremente.
Esta evolución está siendo acelerada por los requisitos reglamentarios que simplemente no encajan con el modelo de nube primero. Los servicios financieros, la atención médica y los clientes del gobierno a menudo no permiten que los datos abandonen sus instalaciones.
Para estos sectores, la estimación de la división representa los requisitos de consentimiento en lugar de elección. En lugar de ser restringido, esta restricción está innovando en la computación de borde y el hardware especializado que hace que la implementación local de IA aumente.
Infraestructura
Los proveedores de la nube ciertamente no se paran. Están desarrollando servicios específicos de IA, mejorando el acceso a la GPU y creando nuevos modelos de precios. Sin embargo, los requisitos de recursos de IA y la economía tradicional de la nube en la nube sugieren que el futuro no será fácil para la revolución de las sales.
En cambio, nos estamos moviendo hacia un paisaje más donde diferentes tipos de presión de trabajo de IA encuentran sus casas naturales. Las pruebas y la prototipos rápidos probablemente permanecerán en la nube local. Los supuestos de producción para los productos establecidos pueden abordar la propiedad de la infraestructura. Las ejecuciones de capacitación se pueden dividir en hardware dedicado para los ejemplos de spot en la nube y modelos de misión crítica para las habilidades de gasto.
El procedimiento representa un paso hacia las técnicas de infraestructura que coinciden con las necesidades reales de los sistemas de inteligencia artificial, pero en lugar de diseñados para sus diferentes tipos de computación diseñados para diseñados para la informática.
Las compañías de IA más exitosas de la próxima década probablemente pueden ser las que piensan en la suposición de la nube primero y crear estrategias de infraestructura sofisticadas como su algoritmo.
Presentamos el mejor almacenamiento en la nube.
Este artículo fue producido como parte del canal de Insight Specialist TechRaderPro, donde somos la mejor y brillante mente brillante en la industria de la tecnología. Las opiniones publicadas aquí están en el autor y no son esenciales para TechroderPro o Future PLC. Si está interesado en contribuir, busque más aquí: https://www.techradar.com/news/submit-your-totory-techradar-pradar