Ποια είναι η κινεζική DeepSeek και γιατί προκαλεί «φρίκη» στον κόσμο της Τεχνητής Νοημοσύνης

Η εμφάνιση της DeepSeek μπορεί να προσφέρει έναν αντίλογο στην ευρέως διαδεδομένη πεποίθηση ότι το μέλλον της τεχνητής νοημοσύνης θα απαιτεί ολοένα και μεγαλύτερες ποσότητες ισχύος και ενέργειας για να αναπτυχθεί

Ποια είναι η κινεζική DeepSeek και γιατί προκαλεί «φρίκη» στον κόσμο της Τεχνητής Νοημοσύνης

Η κινεζική startup τεχνητής νοημοσύνης DeepSeek προκαλεί ισχυρούς τριγμούς στα διεθνή χρηματιστήρια, καθώς προκαλεί έντονο προβληματισμό σχετικά με την τεχνολογική κυριαρχία της Αμερικής.

«Η DeepSeek δείχνει ότι είναι εφικτή η ανάπτυξη ισχυρών μοντέλων τεχνητής νοημοσύνης με χαμηλότερο κόστος», δήλωσε ο Vey-Sern Ling, διευθύνων σύμβουλος της Union Bancaire Privee. «Αυτό μπορεί ενδεχομένως να εκτροχιάσει την επενδυτική αντίληψη για ολόκληρη την αλυσίδα εφοδιασμού τεχνητής νοημοσύνης».

Η εμφάνιση της DeepSeek μπορεί να προσφέρει έναν αντίλογο στην ευρέως διαδεδομένη πεποίθηση ότι το μέλλον της τεχνητής νοημοσύνης θα απαιτεί ολοένα και μεγαλύτερες ποσότητες ισχύος και ενέργειας για να αναπτυχθεί.

Οι παγκόσμιες τεχνολογικές μετοχές βρίσκονται στο μάτι του κυκλώνα τις τελευταίες ημέρες, καθώς ο θόρυβος γύρω από την καινοτομία της DeepSeek πήρε διαστάσεις χιονοστιβάδας και οι επενδυτές έχουν αρχίσει να αξιολογούν τις επιπτώσεις για τους ανταγωνιστές της με έδρα τις ΗΠΑ αλλά και τους προμηθευτές υλικών προς αυτές.

Τι ακριβώς είναι η DeepSeek;

Η DeepSeek ιδρύθηκε το 2023 από τον Liang Wenfeng. Η εταιρεία αναπτύσσει μοντέλα τεχνητής νοημοσύνης που είναι ανοικτού κώδικα, πράγμα που σημαίνει ότι η κοινότητα προγραμματιστών στο σύνολό της μπορεί να επιθεωρεί και να βελτιώνει το λογισμικό. Η εφαρμογή της για κινητά εκτοξεύτηκε στην κορυφή των charts λήψης iPhone στις ΗΠΑ μετά την κυκλοφορία της στις αρχές Ιανουαρίου.

Η εφαρμογή διακρίνεται από άλλα chatbots, όπως το ChatGPT της OpenAI, αρθρώνοντας το σκεπτικό της πριν δώσει απάντηση σε μια προτροπή. Η εταιρεία ισχυρίζεται ότι η έκδοση R1 της προσφέρει επιδόσεις εφάμιλλες με τις τελευταίες του OpenAI και έχει παραχωρήσει άδεια σε άτομα που ενδιαφέρονται να αναπτύξουν chatbots χρησιμοποιώντας την τεχνολογία για να βασιστούν σε αυτήν.

Πώς συγκρίνεται το DeepSeek R1 με το OpenAI ή το Meta AI;

Αν και η εταιρεία δεν έχει δώσει πλήρη στοιχεία, το κόστος εκπαίδευσης και ανάπτυξης των μοντέλων της DeepSeek φαίνεται να είναι μόνο ένα κλάσμα αυτού που απαιτείται για τα καλύτερα προϊόντα της OpenAI ή της Meta Platforms Inc. (META). Η πολύ καλύτερη αποδοτικότητα του μοντέλου θέτει υπό αμφισβήτηση την ανάγκη για τεράστιες δαπάνες κεφαλαίων για την απόκτηση των τελευταίων και ισχυρότερων επιταχυντών τεχνητής νοημοσύνης από εταιρείες όπως η Nvidia Corp.

Αυτό ενισχύει επίσης την προσοχή στους περιορισμούς των εξαγωγών τέτοιων προηγμένων ημιαγωγών από τις ΗΠΑ προς την Κίνα, οι οποίοι είχαν ως στόχο να αποτρέψουν μια ανακάλυψη τέτοιου είδους που φαίνεται να αντιπροσωπεύει η DeepSeek.

Η DeepSeek λέει ότι το R1 είναι κοντά ή καλύτερο από τα ανταγωνιστικά μοντέλα σε διάφορα κορυφαία benchmarks, όπως το AIME 2024 για μαθηματικές εργασίες, το MMLU για γενικές γνώσεις και το AlpacaEval 2.0 για την απόδοση ερωτήσεων και απαντήσεων. Κατατάσσεται επίσης μεταξύ των κορυφαίων επιδόσεων σε έναν πίνακα κατάταξης που συνδέεται με το UC Berkeley και ονομάζεται Chatbot Arena.

Ροή Ειδήσεων Δημοφιλή