Abstract:
El uso de algoritmos inteligentes en la búsqueda de decaimientos de partículas en experimentos de altas energías representa una valiosa oportunidad tanto para las ciencias de la información como para la física de altas energías. Estas técnicas tienen el potencial de mejorar la clasificación de diversos decaimientos en este contexto. Si bien el aprendizaje automático ya ha demostrado su utilidad en la física de altas energías, con mejoras significativas en diferentes áreas y experimentos, cada proyecto experimental tiene requisitos específicos para alcanzar sus objetivos. Esta tesis se enfoca en la clasificación del decaimiento del leptón tau en el experimento Belle II. El objetivo es probar diversos algoritmos de inteligencia artificial para clasificar un decaimiento en particular: el decaimiento $\tau \to \pi^+ \mu^- \mu^- \nu_\tau$, el cual aún no ha sido observado. Además, la metodología desarrollada puede ser extendida para considerar otros decaimientos que compartan características similares, es decir, aquellos que no presenten cambios en el número de partículas, sino en su tipo. El experimento Belle II, conocido como una ``fábrica de mesones B", produce una cantidad considerable de leptones tau. Durante el proceso de reconstrucción, se disponen de 162 variables relacionadas con el decaimiento en estudio. Este punto de encuentro entre las ciencias de la información y la física de altas energías es crucial, ya que la creación del conjunto de datos de entrada para los algoritmos de clasificación depende del decaimiento en estudio. El primer desafío al que nos enfrentamos es determinar si todas las variables del conjunto inicial son relevantes para los algoritmos de clasificación, o si es posible descartar algunas de ellas para evitar la conocida ``maldición de la dimensión". Para ello, se desarrolla una metodología de selección de variables que combina dos enfoques: el filtrado y la envoltura. El resultado es una metodología híbrida que extrae las mejores características de ambos enfoques. Posteriormente, se realiza un breve análisis del origen de los datos para seleccionar los algoritmos de clasificación más apropiados. Sin embargo, esto no limita la posibilidad de aplicar otros algoritmos. Los algoritmos seleccionados incluyen regresión logística, árboles de decisión, máquinas de vectores de soporte y perceptrón multicapa. Una vez que se han determinado las variables relevantes y la técnica de aprendizaje automático adecuada, el objetivo en el problema de clasificación binaria es maximizar su rendimiento mediante el ajuste de los hiperparámetros correspondientes y la aplicación de las métricas de evaluación apropiadas para el problema en cuestión. Por último, mencionamos dos propuestas que pueden ser implementadas en el experimento Belle II con el objetivo de ser consideradas por la colaboración para una posible incorporación en los análisis de decaimientos futuros. Propuestas que toman en cuenta las principales aportaciones del trabajo, las cuales se basan en una selección de variables por medio de un método híbrido que permite reducir el número de clasificadores a construir y establecer el rendimiento para determinar un buen clasificador.