En 2006, Xu Mai, un estudiante de doctorado en el Imperial College, compró su primer teléfono móvil 3G. En ese momento, China todavía no tenía una red 3G, Xu mai quería adelantarse a la experiencia extranjera, pero encontró que los servicios multimedia comunes no podían funcionar en la red 3G, lo que dio lugar a la experiencia de uso y 2G básicamente lo mismo, por lo que decidió devolver las mercancías.
Recientemente, Xu Mai, Profesor de la Universidad de Aeronáutica y Astronáutica de Beijing, fue galardonado con el Premio de transformación de logros juveniles sobresalientes por la 24ª Asociación China de Ciencia y tecnología. “Ya sea 3G, o 5G, son infraestructuras de información, como autopistas”, dijo, refiriéndose al pasado. “Si no hay coches en la autopista que coincidan con ellos, es decir, no hay contenido mediático adecuado, se convierte en un gran desperdicio. La investigación de Codificación de vídeo basada en la percepción que mi equipo y yo hicimos fue hacer coches con especificaciones adecuadas para la autopista”.
Después de más de 20 años de cultivo profundo, el fabricante de automóviles, que ha logrado muchos resultados de investigación en el campo multimedia 5G, recientemente presentó su experiencia académica y los resultados de la investigación a los periodistas de SCI – Tech Daily.
Me gusta la emoción de la investigación científica.
En 1999, Xu mai fue admitido en la Universidad de Aeronáutica y Astronáutica de Beijing y se especializó en ingeniería de comunicaciones. “La razón por la que elijo esta especialidad es simple, porque es muy caliente. Además, ya me gusta la ingeniería, la elección es lógica.” Recordó.
Después de completar sus estudios de pregrado, Xu mai estudió para su maestría en la Universidad Tsinghua. ¿Al graduarse de su maestría, Xu Mai se enfrentó a una elección importante en su vida: ir a trabajar en una empresa o seguir estudiando para la investigación científica? Al igual que muchos graduados, Xu no pudo tomar una decisión inmediata, por lo que consultó al profesor Zhang Lin de la Universidad Tsinghua.
Zhang Lin de su propia experiencia le dijo a Xu mai: si quiere trabajar creativamente, seguir leyendo es la opción correcta.
A Xu le gustaba la emoción de la investigación científica y finalmente decidió ir al Imperial College para obtener su doctorado. Durante su estancia en Londres, fue guiado por Maria Petru, experta en inteligencia artificial y visión automática. Después de graduarse, Xu mai regresó a la Universidad Tsinghua para participar en la investigación post – doctoral, comenzó a trabajar en el campo de la tecnología de Codificación de vídeo basada en la percepción.
La elección de esta dirección se basa en el principio de Xu mai de que la investigación científica debe satisfacer las principales necesidades del país. “La solución de los problemas que el país y la sociedad necesitan urgentemente es naturalmente más fácil de lograr resultados y mayores beneficios sociales.” Dijo.
Mirando hacia atrás en su carrera de investigación científica, Xu mai quiere agradecer a la mayoría de las personas que le dan orientación académica de los mentores. Además, Xu mai también está particularmente agradecido por los tiempos y las oportunidades sociales que le han dado.
Deja que el algoritmo simule la forma en que los ojos humanos procesan la información.
El tiempo vuelve a la era 2G – 2003. En ese momento, un tecnólogo predijo audazmente que un día la gente podría ver videos en línea desde sus teléfonos móviles. En ese momento, mucha gente lo consideraba caprichoso. Sin embargo, casi 20 años después, ver video corto, transmisión en vivo en línea se ha convertido en una parte de la vida diaria de las personas.
“Este es el cambio más intuitivo de la era 2G a la era 5G.” “Las” carreteras “se han ampliado, y los” coches “que corren por las carreteras son diferentes”, explica Xu. “Primero hay texto, luego videos descargables, luego streaming, y ahora video corto y transmisión en vivo… La mejora de la infraestructura ofrece la posibilidad de que las formas de medios de comunicación se renueven, y las” carreteras “y” coches “van de la mano, que es el contexto básico del desarrollo de la tecnología de la comunicación”.
El progreso de la tecnología de la información y las comunicaciones ha dado lugar a una velocidad de red más rápida y a una mayor capacidad de ancho de banda, pero las necesidades de las personas también están aumentando día a día. En la era 5G, la gente no sólo quiere ver vídeo de alta definición, sino también empezar a pensar en múltiples perspectivas e incluso experiencia de inmersión panorámica. Además, con el desarrollo de la economía social, cada vez más usuarios acceden a la red. Frente a estas necesidades, si no podemos controlar el tamaño y la cantidad del “coche”, incluso una “carretera” tan amplia como 5G no será suficiente.
El trabajo principal de Xu mai y sus miembros del equipo es controlar el tamaño del vídeo mediante el ahorro de velocidad y la reducción de la complejidad. Haga que los vídeos de igual definición sean más pequeños en volumen o más claros en volumen.
En los últimos diez años, Xu Mai ha llevado a los miembros del equipo a establecer una nueva arquitectura para la convergencia de la computación de vídeo y la comunicación, que puede ahorrar más del 60% de la tasa de bits y reducir la complejidad en más del 50%. Combinó el caso para introducir a los periodistas, una empresa de vídeo de red de tamaño medio, siempre y cuando ahorre el 10% de la tasa de bits, puede ahorrar decenas de millones de dólares en costos de alquiler de ancho de banda, además de una experiencia de vídeo más suave y clara también ganará más usuarios para la empresa.
Además, la codificación de vídeo basada en los sentidos, es decir, el ahorro de velocidad de vídeo mediante algoritmos que imitan el sistema de percepción humana, es también una de las direcciones de investigación del equipo Xu mai. “En la actualidad, hay dos ideas de investigación: una es hacer que el algoritmo simule el sistema de procesamiento visual humano, reduciendo la carga de información de vídeo mediante la predicción de la atención humana y difuminando la información fuera de la atención; la otra es hacer que el algoritmo simule el conocimiento previo humano, es decir, La capacidad de construir una imagen completa a través de la información estructural.” “Xu mai introduce.
“Algunos estudios han demostrado que el ancho de banda de transmisión visual de las células ganglionares retinianas humanas es de alrededor de 8 megabytes. El ojo humano puede transmitir tanta información con tan poco ancho de banda, que es inseparable del mecanismo del sistema de procesamiento visual humano. Nuestro objetivo es permitir que el algoritmo aprenda de los humanos, simular el procesamiento de la información del ojo humano, reduciendo así en gran medida la carga de información de vídeo.” “Xu mai concluye.
Presta atención al cultivo y la ayuda de los estudiantes.
Como profesor universitario, Xu mai no sólo debe llevar a cabo la investigación científica, sino también a los estudiantes. Xu mai había recibido la ayuda de muchos maestros en sus días de estudiante, pero ahora se ha convertido en un maestro, y presta mucha atención al cultivo y la ayuda de los estudiantes.
“Los estudiantes se aplican a una buena escuela, que yo mismo solicité el éxito también es feliz. Xu mai suspiró.
Recordando que había dirigido a muchos estudiantes de maestría, Xu dijo que todos ellos tienen una fuerte capacidad de investigación científica, incluyendo a la Universidad de Oxford, el Instituto Imperial de tecnología, el Instituto Federal de tecnología de Zurich y otras escuelas internacionales famosas para continuar sus estudios, as í como a la Academia China de Ciencias y otras instituciones de investigación científica o empresas de Internet, y muchos estudiantes se han convertido en la columna vertebral de los institutos de investigación científica o empresas comerciales.
Xu recordó que había recomendado a un estudiante para estudiar en el extranjero, y más tarde recibió una carta de agradecimiento de su tutor de doctorado, afirmando la capacidad de investigación científica y aprendizaje del estudiante, lo que le dio una sensación de logro.
“Mi fuerza es limitada, sólo puedo llevar a un equipo a hacer las cosas, pero si puedo entrenar a un grupo de personas para que todos puedan llevar a su equipo a servir a las necesidades estratégicas del país, la construcción socioeconómica, es igual a que el significado de mi trabajo se amplió diez veces, cien veces.” Dijo Xu mai.
En la actualidad, en el ámbito de los multimedia, el desarrollo tecnológico y la formulación de normas en China están a la vanguardia del mundo, pero hay una cierta brecha entre la teoría básica y los países desarrollados. Xu mai piensa que esta placa corta puede causar que China esté en posición pasiva en la iteración de la tecnología. “En la investigación científica futura, el cultivo de talentos, la investigación básica es la máxima prioridad. Para mantener la” Autopista de la información “abierta y avanzada, se necesita una generación de investigadores para continuar con la lucha. Dijo.