Kingman Minerals:
Bohrungen abgeschlossen, Ergebnisse stehen kurz bevor! Jetzt rein?
Anzeige
MICRON TECHNOLOGY WKN: 869020 ISIN: US5951121038 Forum: Aktien Thema: Hauptdiskussion
411,80
EUR
-1,26 % -5,28
15:21:42 Uhr,
Baader Bank
Kommentare 9.502
Tatentot,
27. Mär 12:09 Uhr
0
Kauft nicht, Leute. Ich habe gestern verkauft und möchte jetzt wieder günstig einsteigen.
Travis_KC,
27. Mär 12:23 Uhr
0
Spätestens um 14.30 geht es gegen 290 oder tiefer. Wie ich gestern geschrieben habe: die dummen Amis scheißen sich schon jeden normalen Freitag die Hosen voll bis oben hin. Das wird heute nicht anders sein!
Travis_KC,
27. Mär 9:20 Uhr
0
Naürlich ist die Marktreaktion übertrieben. So wie sie derzeit auf jegliche Nachricht, die irgendwie negativ interpretiert werden kann, vollkommen überzogen ist und gute News mehr oder weniger vollständig ausgeblendet werden.
Tapir6,
27. Mär 8:27 Uhr
0
MU KGV nur noch 6,14 (2026e), zum Vergleich: Nvidia 35, Infineon 35, SAP 21, Microsoft 21, ASML 39, Palantir 129;
Tapir6,
27. Mär 8:05 Uhr
0
https://stock3.com/news/micron-aktie-faellt-wegen-turboquant-vor-einem-jahr-16996083
Die Marktreaktion auf Googles TurboQuant wird nicht nur von mir, aber auch von zahlreichen Speicherchip-Experten als überzogen dargestellt. So beruht der Abverkauf bei Speicherwerten wie SanDisk oder Micron auf einer Fehlinterpretation der Relevanz dieser Entwicklung.
Einfach gesagt geht es bei TurboQuant nicht darum, dass plötzlich viel weniger Speicherchips gebraucht werden, sondern darum, dass ein KI-Modell mit dem vorhandenen Speicher effizienter umgehen kann. Genau wie bei Deepseek gilt Jevons Paradoxon.
Was ist KV-Cache?
KV-Cache ist eine Art Kurzzeitgedächtnis eines Sprachmodells. Darin speichert das Modell laufend Informationen aus dem bisherigen Gespräch oder Text, damit es beim nächsten Wort noch weiß, was vorher gesagt wurde. Das meine ich auch, wenn ich von Kontext-Fenster spreche. Dieser Zwischenspeicher braucht Platz im Arbeitsspeicher, besonders bei langen Eingaben und großen Modellen.
TurboQuant ist nun eine Methode, um diese gespeicherten Informationen platzsparender abzulegen.
Man kann sich das so vorstellen, als würde man eine große Datei komprimieren, damit sie weniger Speicher belegt. Das Ziel ist, dass das Modell möglichst wenig Qualität verliert, obwohl die Daten stärker zusammengepresst werden.
Der Markt tut so, als wäre das ein riesiger Einbruch für den Bedarf an Speicherchips. Denn vieles in diesem Bereich ist schon heute nicht mehr in einer besonders speicherintensiven Form gespeichert.
Ein Teil der Einsparung, über die jetzt gesprochen wird, wurde in der Praxis bereits vorher erreicht.
Deshalb ist der zusätzliche Effekt von TurboQuant im realen Einsatz kleiner als manche Schlagzeilen vermuten lassen.
Relevant kann das Verfahren trotzdem sein, vor allem bei Edge-Anwendungen. Also, wenn KI-Anwendungen direkt auf dem Gerät ausgeführt werden. Zum Beispiel Smartphones, Laptops, Autos oder andere Hardware mit begrenztem Speicher. Dort ist jeder eingesparte Speicherbaustein besonders wertvoll, weil die Systeme kleiner, günstiger oder schneller werden können.
Darüberhinaus beseitigt Googles TurboQuant den Rechenaufwand nicht, sondern verlagert ihn. Demnach muss die GPU bei jedem Zugriff zusätzliche Arbeit leisten, um Vektoren zu komprimieren und wieder zu entpacken, was den Energieverbrauch pro Inferenz erhöhen kann.
Eine weitere Folge ist höhere Latenz. Während Daten in einem klassischen Setup direkt aus dem Speicher gelesen werden, sind bei TurboQuant zunächst mathematische Umformungen nötig, bevor das Modell überhaupt das erste Wort ausgeben könne.
Auch beim Streaming gibt es Nachteile. Statt einer fortlaufenden Wort-für-Wort-Ausgabe kann die Ausgabe hier blockweise erfolgen, sodass die Oberfläche zunächst für mehrere Sekunden einfriert und anschließend größere Textblöcke auf einmal ausgibt.
Schließlich verbraucht der Deep-Thinking-Modus intern mehr Rechenzyklen statt weniger, wodurch Nutzer schneller an Limits stoßen oder nach wenigen Nachrichten sogar zeitweise gesperrt werden könnten.
TurboQuant bringt keinen kostenlosen Effizienzgewinn, sondern mögliche Entlastung beim Speicher mit höherem Aufwand bei GPU/Rechenleistung, Latenz und Nutzungskosten
Fazit
TurboQuant kann helfen, KI effizienter zu machen, aber das ist nicht automatisch gleichbedeutend mit einem massiven Einbruch der gesamten Speichernachfrage.
Als weiterer Vergleich wird DeepSeeks MLA genannt, das den KV-Cache bereits um den Faktor 28 komprimiert habe.
Vor allem aber ist die aktuelle Aufmerksamkeit für TurboQuant extreeeem verspätet, zumal die eingeblendete arXiv-Seite den Preprint bereits auf den 28. April 2025 datiert.
Warlock2024,
26. Mär 21:52 Uhr
2
Der WTI ist kurz abgesackt und steigt auch wieder, dem glaubt doch kein Mensch mehr. Die Kurse könnten morgen kurz steigen, wird dann aber auch wieder abverkauft - weil es keiner übers Wochenende halten möchte.
Travis_KC,
26. Mär 21:35 Uhr
0
Oder auch nicht. Trump hat das Ultimatum bis Ostermontag verlängert. Morgen dürfte erstmal hochgehen.
Meistdiskutiert
|
|
Thema | ||
|---|---|---|---|
| 1 | Canopy Hauptforum | +9,30 % | |
| 2 | Hims & Hers Health Registered (A) Hauptdiskussion | +5,12 % | |
| 3 | Dax Prognose | -0,30 % | |
| 4 | DAX Hauptdiskussion | -0,30 % | |
| 5 | Trading- und Aktien-Chat | ||
| 6 | Tilray Brands Hauptforum | +18,55 % | |
| 7 | SERVICENOW Hauptdiskussion | -12,82 % | |
| 8 | EUROPEAN LITHIUM Hauptdiskussion | +10,89 % | |
| 9 | ROHÖL WTI Hauptdiskussion | +0,65 % | |
| 10 | ATOS Hauptdiskussion | -6,71 % | Alle Diskussionen |
Aktien
|
|
Thema | ||
|---|---|---|---|
| 1 | Canopy Hauptforum | +8,96 % | |
| 2 | Hims & Hers Health Registered (A) Hauptdiskussion | +5,12 % | |
| 3 | Tilray Brands Hauptforum | +17,24 % | |
| 4 | SERVICENOW Hauptdiskussion | -12,82 % | |
| 5 | EUROPEAN LITHIUM Hauptdiskussion | +10,89 % | |
| 6 | ATOS Hauptdiskussion | -6,71 % | |
| 7 | Beyond Meat Hauptdiskussion | +2,32 % | |
| 8 | Investmentchancen | +5,12 % | |
| 9 | Novo Nordisk nach Split | -0,28 % | |
| 10 | Mercedes-Benz Group Hauptdiskussion | +0,04 % | Alle Diskussionen |