Processo di “fine-tuning” del modello “Granite” di IBM utilizzando la tecnica “Low-Rank Adaptation (LoRA)” per adattare i Large Language Models (LLMs) a compiti specifici come il question answering, sentiment analysis o text summarization.
Questo permette di migliorare la precisione delle risposte del modello per applicazioni specializzate.
Viene utilizzata anche la libreria Optuna per ottimizzare i parametri in modo automatico, senza errori manuali, e i risultati sono valutati tramite la metrica di similarità basata su BERT.
hashtag#AI hashtag#MachineLearning hashtag#LLMs hashtag#GraniteModel hashtag#LoRA hashtag#Optuna hashtag#FineTuning hashtag#Transformers hashtag#NaturalLanguageProcessing hashtag#DataScience hashtag#AIInnovation hashtag#BERT hashtag#ModelOptimization hashtag#DeepLearning
Supervised fine-tuning of the open source IBM Granite model using transformers