Υπάρχουν περίπου 3.000 ποικιλίες γεύσεων τσαγιού. Όλες αυτές οι ποικιλίες τσαγιού προέρχονται από τα φύλλα του αειθαλούς θαμνώδους φυτού Camellia sinensis (γνωστού και ως δέντρο τσαγιού). Οι πιο δημοφιλείς κατηγορίες περιλαμβάνουν 4 διαφορετικούς τύπους, όπως το λευκό, το μαύρο, το πράσινο και το oolong. Παρά την τεράστια πολιτιστική και οικονομική σημασία του φυτού, σχετικά λίγα ήταν γνωστά για το DNA του είδους. Ωστόσο, το πρώτο σχέδιο γονιδιώματος του είδους δημοσιεύθηκε την 1η Μαΐου 2017 στο περιοδικό Molecular Plant (The tea tree genome provides insights into tea flavor and independent evolution of caffeine biosynthesis). Το δημοσίευμα επιτρέπει να εξηγηθεί πως τα φύλλα τσαγιού είναι τόσο ξεχωριστά σε σχέση με άλλα συγγενικά φυτικά είδη και είναι τόσο πλούσια σε τόση μεγάλη ποικιλία αντιοξειδωτικών και καφεΐνης. Επιπλέον, επιτρέπει το δημοσίευμα να επιλυθεί το μυστήριο, του ποια είναι η γενετική βάση που καθορίζει το να παράγονται τόσο πολλές διαφορετικές γεύσεις στο ίδιο φύλλο.
Προηγούμενες μελέτες είχαν δείξει ότι το τσάι οφείλει μεγάλο μέρος της γεύσης του σε μια ομάδα αντιοξειδωτικών που ονομάζονται φλαβονοειδή, μόρια που πιστεύεται ότι βοηθούν τα φυτά να επιβιώσουν στο περιβάλλον τους. Το γευστικό φλαβονοειδές, που ονομάζεται κατεχίνη, σχετίζεται ιδιαίτερα με τη γεύση του τσαγιού. Τα επίπεδα κατεχίνης και άλλων φλαβονοειδών ποικίλλουν μεταξύ των ειδών Camellia, όπως και η καφεΐνη. Η καφεΐνη, τα φλαβονοειδή όπως οι κατεχίνες δεν είναι πρωτεΐνες (και επομένως δεν κωδικοποιούνται απευθείας από το DNA), αλλά παράγονται σε βιοχημικά μονοπάτια από τις πρωτεΐνες που κωδικοποιούνται από το γενετικό υλικό του φυτού.
Οι ερευνητές διαπίστωσαν, ότι το γονιδίωμα του είδους είναι τεράστιο, περίπου 4 φορές μεγαλύτερο από του καφεόδενδρου. Αυτό σημαίνει ότι πάρα πολλά γονίδια που καθορίζουν πρωτεΐνες είναι διπλασιασμένα ή τριπλασιασμένα ή ακόμη και 100πλασιασμένα. Με μικρή διαφοροποίηση τους μπορεί να οδηγούν στην παραγωγή διαφορετικών πρωτεϊνών, που στο βιοχημικό μονοπάτι που συμμετέχουν να επηρεάζουν τις ιδιότητες των γεύσεων του τσαγιού.

Ακόμη πιο εντυπωσιακό, το 67%!!!! των αλληλουχιών του DNA του τσαγιού είναι ρετροφερόνια (δηλαδή επαναλαμβανόμενες αλληλουχίες μεταθετών στοιχείων, οι οποίες μπορεί να χοροπηδάνε στο γονιδίωμα του είδους) και ως εκ τούτου να επικολλούνται σε διαφορετικά σημεία του γονιδιώματος και μάλιστα πάρα πολλές φορές. Οι ερευνητές πιστεύουν ότι αυτές οι επαναλαμβανόμενες οικογένειες γονιδίων που εισβάλουν σε διάφορα μέρη του γονιδιωμάτος, μαζί με τα πολλαπλά αντίγραφα δομικών γονιδίων είναι υπεύθυνα στην παραγωγή πολύ διαφορετικών ποικιλιών φλαβονοειδών και κατεχίνης στο είδος.