Vinkvalitetsanalyse – BI
Vinkvalitetsanalyse – BI
Et business intelligence-projekt der analyserer kemiske egenskaber i rød- og hvidvin for at identificere, hvad der driver oplevet kvalitet. Projektet gennemfører hele data science-arbejdsgangen fra dataindsamling og rensning til statistisk validering og konklusion.
Analysen viser, at alkohol er den stærkeste kvalitetsprediktor, mens flygtig syre er den primære negativ faktor. Hvidvine indeholder i gennemsnit højere alkohol- og syreindhold end rødvine — på trods af den gængse opfattelse.
Metode
- Hypotesetestning med statistiske T-tests
- Feature-analyse og fjernelse af redundante variable (densitet, total SO2)
- Sammenligning af tre normaliseringsmetoder — robust scaling fungerede bedst til outlier-tunge data
Teknologier: Python · Pandas · NumPy · SciPy · Scikit-learn · Matplotlib · Seaborn