nVidia GPU - Το επίσημο νήμα συζήτησης.

nitro912gr · Sep 1, 2015

για μια ακόμα φορά η nvidia κοροϊδεύει τον κόσμο στα μούτρα του και ο κόσμος γουστάρει :facepalm:
Αν είχε λίγη αξιοπρέπεια θα έβγαινε και θα έλεγε την αλήθεια ότι δεν υποστηρίζει asyncπωςτολεν και όχι να προσπαθεί να κάνει σαμποτάζ σε επίπεδο software... δηλαδή πόσο γύφτοι;

Όσοι είστε σε 7ΧΧ και πίσω στα win10 πως τα πάτε; Μου είπε ένας φίλος ότι υπάρχουν προβλήματα με drivers.

Chronomancy · Sep 1, 2015

Δεν είχα πρόβλημα με την 760 αλλά έχω κάνει οπισθοχώρηση σε 8.1 οπότε δεν ξέρω τι παίζετε τούτη την ώρα

ccwr · Sep 1, 2015

Δηλαδή, για να καταλάβω. Το πρόβλημα είναι ότι η προηγούμενη γενιά nvidia (Maxwell 1) δεν υποστηρίζει asychronous shading ενώ η τελευταία γενιά AMD υποστηρίζει;
Η δεύτερη γενιά maxwell υποστηρίζει αλλά όχι όσο καλά θα έπρεπε λόγο drivers;

Αναρωτιέμαι πιο θα είναι το πραγματικό performance impact. To thief δεν χρησιμοποιεί ήδη αυτή την τεχνική; Πόσο καλύτερα δουλεύει πια; οκ η amd μόλις τώρα καρπώνεται τα οφέλη του mantle, ή αυτό καταλαβαίνω εγώ.

Κι όλα αυτά βέβαια, θα έχουν σημασία στο μέλλον, μιας και ακόμα υπάρχουν σχεδόν μόνο εσωτερικά tech demos ή παιχνίδια του PS4;

erevos · Sep 1, 2015

ccwr wrote:
Δηλαδή, για να καταλάβω. Το πρόβλημα είναι ότι η προηγούμενη γενιά nvidia (Maxwell 1) δεν υποστηρίζει asychronous shading ενώ η τελευταία γενιά AMD υποστηρίζει;
Η δεύτερη γενιά maxwell υποστηρίζει αλλά όχι όσο καλά θα έπρεπε λόγο drivers;

Αναρωτιέμαι πιο θα είναι το πραγματικό performance impact. To thief δεν χρησιμοποιεί ήδη αυτή την τεχνική; Πόσο καλύτερα δουλεύει πια; οκ η amd μόλις τώρα καρπώνεται τα οφέλη του mantle, ή αυτό καταλαβαίνω εγώ.

Κι όλα αυτά βέβαια, θα έχουν σημασία στο μέλλον, μιας και ακόμα υπάρχουν σχεδόν μόνο εσωτερικά tech demos ή παιχνίδια του PS4;</blockquote>

Όχι, το πρόβλημα είναι ότι καμία γενιά Maxwell δεν υποστηρίζει Async Compute, ενώ μάλιστα έλεγαν ότι το υποστηρίζουν.
Το performance & visual impact είναι σημαντικότατο σε αυτή τη περίπτωση, καθώς εδώ μιλάμε για ένα από τα βασικά features του DX12. Ήδη στο Ashes of Singularity αναγκάστηκαν να το ρίξουν αρκετά, καθώς σε Nvidia κάρτες τα αποτελέσματα ήταν καταστροφικά.

ccwr · Sep 1, 2015

<blockquote>Fermi/Kepler/Maxwell 1 can only use a single graphics queue or their complement of compute queues, but not both at once – early implementations of HyperQ cannot be used in conjunction with graphics. Meanwhile Maxwell 2 has 32 queues, composed of 1 graphics queue and 31 compute queues (or 32 compute queues total in pure compute mode). So pre-Maxwell 2 GPUs have to either execute in serial or pre-empt to move tasks ahead of each other, which would indeed give AMD an advantage..</blockquote>

<img src="http://s16.postimg.org/rd7qt551h/Untitled.png" alt="Untitled.png" class="bbcode_img" />

http://www.anandtech.com/show/9124/amd-dives-deep-on-asynchronous-shading

<blockquote>Note: Nvidia has represented to ExtremeTech and other hardware sites that Maxwell 2 (the GTX 900 family) is capable of asynchronous compute, with one graphics queue and 31 compute queues. We are investigating this situation. It is not clear how these compute queues are accessed or what the performance penalty is for using them; </blockquote>

http://www.extremetech.com/gaming/213202-ashes-dev-dishes-on-dx12-amd-vs-nvidia-and-asynchronous-compute

Τόσο λάθος κατάλαβα; ή απλά λένε ψέματα;

Edit: κι https://www.reddit.com/r/nvidia/comments/3j5e9b/analysis_async_compute_is_it_true_nvidia_cant_do/" class="bbcode_url">εδώ τα λέει ωραία.

Chronomancy · Sep 1, 2015

https://www.youtube.com/watch?v=L9viHvnAS4M

nitro912gr · Sep 1, 2015

What is most startling here is that Nvidia's own drivers tries to claim that Nvidia's GPUs has support for DirectX 12 asynchronous compute, which is something that Oxide says that their GPUs clearly do not really support. He also states the Nvidia only have a tier 2 DirectX 12 implementation whereas AMD has a tier 3 implementations, meaning that Nvidia has a little more CPU overhead.

http://www.overclock3d.net/articles/gpu_displays/oxide_developer_says_nvidia_was_pressuring_them_to_change_their_dx12_benchmark/1

To anand πάντα ήταν ενοχλητικά nvidia friendly (έτρεχε bench με πιο βαρύ antialiasing στις AMD από ότι στις nvidia και έγραφε "να δείτε, παίζει καλύτερα στην nvidia") αλλά δεν θεωρώ ότι λένε ψέμματα, απλά αναπαράγουν αμάσητο PR material της nvidia.

Γενικά μου φαίνεται παράξενο που τα άλλα 2 site που παρακολουθώ δεν έχουν καμία αναφορά στο θέμα (kitguru, hexus)

edit: διάβαζα στο forum του OC3D και έπεσα πάνω σε αυτό που εξηγεί τι παίζει:
<blockquote>Well, to be fair, Maxwell 2 does support Asynchronous compute. The Asynchronous Warp Schedulers do support this feature. The problem is in terms of context switching. When you enable Async Shading, on Maxwell 2, you have to limit the compute workloads. If you don't, you get a noticeable drop in performance. In essence, Maxwell 2 relies on slow context switching.

I don't know what's causing this issue. So I emailed Oxide, who came to our forums at Overclock.net, and explained the situation. This is where all of this info comes from.

I think it has to do with the L2 Cache shared by all of the CUDA SMMs. I think it might not have the available size and bandwidth to handle the load.

AMDs GCN, on the other hand, has a row of ACEs which reside outside of the Shader Engines. They can communicate trough the R/W L2 Cache, Global Data Share Cache and the GDDR5/HBM memory in order to synchronize, fetch and execute commands.

Another cause might be the DMA engines on Maxwell 2. They might not be as powerful or flexible as the ones found in GCN.

Just a theory.

In the end Maxwell 2 can support the feature, but loses performance when you work it too hard.

It reminds me of the GeForceFX. Which supported Pixel Shader model 2.0, but did so at a terrible performance premium.
</blockquote>

f2bnp · Sep 1, 2015

Τα πράγματα δεν είναι ξεκάθαρα ακόμα. Πριν κανά δίμηνο είχαμε μία συζήτηση σε γειτονικό forum όπου ένας προγραμματιστής μας είπε την δική του άποψη, ότι το 12.1 feature level που δεν υποστηρίζει η AMD θα παίξει μεγάλο ρόλο. Η συζήτηση έσπασε σε αρκετά μέρη για να μην γίνει τελείως de-rail το thread, παραθέτω τα links εδώ για όποιον ενδιαφέρεται:

http://www.vogons.org/viewtopic.php?f=5&t=44115&p=432919&hilit#p432919
http://www.vogons.org/viewtopic.php?f=46&t=44116&p=433014&hilit=#p433014

devilride · Sep 1, 2015

ErevoS wrote:

ccwr wrote:
Δηλαδή, για να καταλάβω. Το πρόβλημα είναι ότι η προηγούμενη γενιά nvidia (Maxwell 1) δεν υποστηρίζει asychronous shading ενώ η τελευταία γενιά AMD υποστηρίζει;
Η δεύτερη γενιά maxwell υποστηρίζει αλλά όχι όσο καλά θα έπρεπε λόγο drivers;

Αναρωτιέμαι πιο θα είναι το πραγματικό performance impact. To thief δεν χρησιμοποιεί ήδη αυτή την τεχνική; Πόσο καλύτερα δουλεύει πια; οκ η amd μόλις τώρα καρπώνεται τα οφέλη του mantle, ή αυτό καταλαβαίνω εγώ.

Κι όλα αυτά βέβαια, θα έχουν σημασία στο μέλλον, μιας και ακόμα υπάρχουν σχεδόν μόνο εσωτερικά tech demos ή παιχνίδια του PS4;</blockquote>

Όχι, το πρόβλημα είναι ότι καμία γενιά Maxwell δεν υποστηρίζει Async Compute, ενώ μάλιστα έλεγαν ότι το υποστηρίζουν.
Το performance & visual impact είναι σημαντικότατο σε αυτή τη περίπτωση, καθώς <span style="color:#ff0044">εδώ μιλάμε για ένα από τα βασικά features του DX12</span>. Ήδη στο Ashes of Singularity αναγκάστηκαν να το ρίξουν αρκετά, καθώς σε Nvidia κάρτες τα αποτελέσματα ήταν καταστροφικά.</blockquote>

απ'οσο γνωρζω/διαβασα το async-compute ΔΕΝ ειναι βασικο στοιχειο του DX12 αρα η εφαρμογη του ή οχι απο καποιες εταιρειες
δεν εχει σχεση με τη συμβατοτητα κ αποδοση των καρτων με αυτο καθ'αυτο το DX12

erevos · Sep 1, 2015

devilride wrote:
απ'οσο γνωρζω/διαβασα το async-compute ΔΕΝ ειναι βασικο στοιχειο του DX12 αρα η εφαρμογη του ή οχι απο καποιες εταιρειες
δεν εχει σχεση με τη συμβατοτητα κ αποδοση των καρτων με αυτο καθ'αυτο το DX12</blockquote>

Πάντως αν googleάρεις dx12 major features, η AMD το αναφέρει διαρκώς ως πολύ σημαντικό. Marketing trick? Ίσως.

Great0ldOne · Sep 1, 2015

O Chief of Technical Marketing της AMD πάντως είπε πως έχει δημιουργηθεί κομφούζιο σχετικά με το DX12 και το ποιος υποστηρίζει τι, και πως οι εταιρείες (χωρίς μάλιστα να βγάζει απέξω την ουρά της AMD) τα έχουν κάνει λίγο μαντάρα παίζοντας ακόμα και με την σημασία της λέξης "υποστήριξη", που έχει καταντήσει να μη σημαίνει τίποτα. Κατέληξε πως αυτή τη στιγμή δεν υπάρχει στην αγορά ΚΑΜΙΑ GPU με "full support" για DX12, καθώς και η 980Ti και η Fury X έχουν missing features.

devilride · Sep 1, 2015

ErevoS wrote:

devilride wrote:
απ'οσο γνωρζω/διαβασα το async-compute ΔΕΝ ειναι βασικο στοιχειο του DX12 αρα η εφαρμογη του ή οχι απο καποιες εταιρειες
δεν εχει σχεση με τη συμβατοτητα κ αποδοση των καρτων με αυτο καθ'αυτο το DX12</blockquote>

Πάντως αν googleάρεις dx12 major features, <span style="color:#ff0044">η AMD το αναφέρει διαρκώς </span>ως πολύ σημαντικό. Marketing trick? Ίσως.</blockquote>

...η AMD μπορει να λεει διαφορα...η microsoft ομως οχι..τουλαχιστον 1 ωρα χαζευω στο msdn.microsoft.com στα features του 12 ειτε για asynch compute / shaders ...κλπ κλπ..ειτε στο shader model 5...ή και στο 5.1 superset που ειναι για τα d12 και d11.3 και δεν το εχει καπου...θα συνεχισω κ αλλο το ψαξιμο αλλα δεν το ειδα

kuivamaa · Sep 1, 2015

ccwr wrote:
<blockquote>Fermi/Kepler/Maxwell 1 can only use a single graphics queue or their complement of compute queues, but not both at once – early implementations of HyperQ cannot be used in conjunction with graphics. Meanwhile Maxwell 2 has 32 queues, composed of 1 graphics queue and 31 compute queues (or 32 compute queues total in pure compute mode). So pre-Maxwell 2 GPUs have to either execute in serial or pre-empt to move tasks ahead of each other, which would indeed give AMD an advantage..</blockquote>

<img src="http://s16.postimg.org/rd7qt551h/Untitled.png" alt="Untitled.png" class="bbcode_img" />

http://www.anandtech.com/show/9124/amd-dives-deep-on-asynchronous-shading

<blockquote>Note: Nvidia has represented to ExtremeTech and other hardware sites that Maxwell 2 (the GTX 900 family) is capable of asynchronous compute, with one graphics queue and 31 compute queues. We are investigating this situation. It is not clear how these compute queues are accessed or what the performance penalty is for using them; </blockquote>

http://www.extremetech.com/gaming/213202-ashes-dev-dishes-on-dx12-amd-vs-nvidia-and-asynchronous-compute

Τόσο λάθος κατάλαβα; ή απλά λένε ψέματα;

Edit: κι https://www.reddit.com/r/nvidia/comments/3j5e9b/analysis_async_compute_is_it_true_nvidia_cant_do/" class="bbcode_url">εδώ τα λέει ωραία.</blockquote>

Eχει κανει πατάτα το Anandtech. Oι radeon από γενιά 1.1 και μετά (δηλαδή από 7790 εως Fury με ολα τα ενδιάμεσα) έχουν 8 ACE (aynchronous compute enginers) με δυνατότητα οχτώ εκτελέσεων η κάθεμια , δηλαδή 64 compute tasks και ένα γραφικό task. Και μπορεί να κάνει και τα δύο (δηλαδή γραφικά και compute) ταυτόχρονα.

Εκεί ειναι το πρόβλημα με τις GeForce. ΟΛΕΣ τους. Απ΄οτι φαίνεται λογω αρχιτεκτονικής, μπορούν να κάνουν γραφικά πολύ γρήγορα, compute επίσης πολύ γρήγορα αλλά όχι και τα δύο ταυτόχρονα. Και το asynchronous shading στο DX12 που το δουλεύουν σχεδόν οι πάντες (νέα Battlefield,Battlefront,Deus Ex, Mirror's Edge κοκ κοκ) κάνει ακριβώς αυτό. Τρέχει τα γραφικά και compute μαζί. Οι radeon μπορούν να το κάνουν αυτό, οι geforce όχι, αν ο κώδικας τους το ζητησει τρέχουν εναλλάξ γραφικά και compute και πάει το framerate στο διάολο. Γι'αυτό ζήτησε η nvidia από την Oxide να βγάλει τους async shaders από το benchmark γιατί παρόλο που είχαν τον κώδικα εδώ και ένα χρόνο, οι πράσινοι δεν μπορούν να το κάνουν να λειτουργήσει στις κάρτες τους λόγω hardware.

Γιατί συμβαίνει αυτό; Γιατί η AMD
α) έστησε το mantle και κατά συνέπεια και το DX12 και το Vulkan (παιδιά του mantle είναι,μοιράζονται πολύ κώδικα) γύρω από τις GCN
β) όλες οι κονσόλες (PS4,Xbone, Wii αλλά και η νεα nintendo) έχουν επίσης AMD γραφικά.

Οπότε οι κόκκινοι επιτίθενται και από την πλευρά των καθαρών PC παιχνιδιών αλλά και από τα ports.

f2bnp wrote:
Τα πράγματα δεν είναι ξεκάθαρα ακόμα. Πριν κανά δίμηνο είχαμε μία συζήτηση σε γειτονικό forum όπου ένας προγραμματιστής μας είπε την δική του άποψη, ότι το 12.1 feature level που δεν υποστηρίζει η AMD θα παίξει μεγάλο ρόλο. Η συζήτηση έσπασε σε αρκετά μέρη για να μην γίνει τελείως de-rail το thread, παραθέτω τα links εδώ για όποιον ενδιαφέρεται:

http://www.vogons.org/viewtopic.php?f=5&t=44115&p=432919&hilit#p432919
http://www.vogons.org/viewtopic.php?f=46&t=44116&p=433014&hilit=#p433014</blockquote>

Ξεκάθαρα ειναι τα πράγματα. Αυτά που δεν υποστηρίζει η AMD πχ. το conservative rasterization μπορεί να το τρέξει με compute. H nvidia όμως δεν υποστηρίζει ολόκληρα tiers του DX12. Και έχει αρχιτεκτονική σαφώς προσανατολισμένη και βελτιστοποιημένη για το DX11.

Tι θα γίνει; Οι AMD κάρτες είναι ανώτερες σε compute όπως βλέπουμε αλλά οι nvidia σε γεωμετρία (το tesselation ειναι γεωμετρικό χαρακτηριστικό). Υποπτεύομαι πως για αντίπραξη (αφού τα ports θα είναι όλα τιγκα radeon friendly από τα αποδυτήρια) θα πιάσει όσους devs μπορεί και θα φυτέψει gameworks χαρακτηριστικά τίγκα στη γεωμετρία για να χτυπήσει τo framerate των Radeon. Γιατί κατά τα άλλα μιλάμε πως αν τα asynchronous shader χαρακτηριστικά δεν περάσουν στο PC (αν αφαιρεθούν με απαίτηση της πράσινης δηλαδή), οι κονσόλες θα τρέχουν πιο προχώ γραφικά. Ανάθεμα για το master race. Αν όμως περάσουν και λειτουργούν μονο σε radeon τότε πάλι υπάρχει θέμα για την nvidia.

erevos · Sep 1, 2015

devilride wrote:
...η AMD μπορει να λεει διαφορα...η microsoft ομως οχι..τουλαχιστον 1 ωρα χαζευω στο msdn.microsoft.com στα features του 12 ειτε για asynch compute / shaders ...κλπ κλπ..ειτε στο shader model 5...ή και στο 5.1 superset που ειναι για τα d12 και d11.3 και δεν το εχει καπου...θα συνεχισω κ αλλο το ψαξιμο αλλα δεν το ειδα</blockquote>

Πιο πιθανό να βρεις ορολογίες όπως multithread, parallel, fast switching κοκ.

kuivamaa · Sep 1, 2015

http://www.overclock.net/t/1569897/various-ashes-of-the-singularity-dx12-benchmarks/400#post_24321843

Από αυτό το post ξεκίνησε η φασαρία. Ο Μahigan ειναι ενας πρώην μηχανικός της ATi που έκανε ενα educated guess, το οποίο αποδείχτηκε αρκετά βάσιμο αφού τον επιβεβαίωσε στο ίδιο thread μεγαλοστέλεχος της Oxide. Το πήραν τα άλλα site ,βγήκε στο reddit και έχει βουήξει το δικτυο. Και η nvidia σιωπή ακόμα (ενώ η AMD σχολίασε). Ισως δεν θα απαντήσει καν ,υποβιβάζοντας το θέμα ,αφού ηγείται στις πωλήσεις.

keymaster · Sep 1, 2015

devilride wrote:
...η AMD μπορει να λεει διαφορα...η microsoft ομως οχι..τουλαχιστον 1 ωρα χαζευω στο msdn.microsoft.com στα features του 12 ειτε για asynch compute / shaders ...κλπ κλπ..ειτε στο shader model 5...ή και στο 5.1 superset που ειναι για τα d12 και d11.3 και δεν το εχει καπου...θα συνεχισω κ αλλο το ψαξιμο αλλα δεν το ειδα</blockquote>

Synchronization and Multi-Engine(https://msdn.microsoft.com/en-us/library/windows/desktop/dn899217(v=vs.85).aspx#asynchronous_compute_and_graphics_example)

devilride · Sep 2, 2015

keymaster wrote:

devilride wrote:
...η AMD μπορει να λεει διαφορα...η microsoft ομως οχι..τουλαχιστον 1 ωρα χαζευω στο msdn.microsoft.com στα features του 12 ειτε για asynch compute / shaders ...κλπ κλπ..ειτε στο shader model 5...ή και στο 5.1 superset που ειναι για τα d12 και d11.3 και δεν το εχει καπου...θα συνεχισω κ αλλο το ψαξιμο αλλα δεν το ειδα</blockquote>

Synchronization and Multi-Engine(https://msdn.microsoft.com/en-us/library/windows/desktop/dn899217(v=vs.85).aspx#asynchronous_compute_and_graphics_example)</blockquote>

..κατα το ημισυ ομως...
χαρακτηριστικα σου λεει
"The compute queue must still wait for the graphics queue to finish with the pipe buffers, but a third fence (pGraphicsComputeFence) is introduced so that the progress of graphics reading compute work versus graphics progress in general can be tracked. "
Ακομα λοιπον κ ετσι οι δυο διαδικασιες προχωρουν ανεξαρτητα μεχρι ενος σημειου..

ετσι κ αλλιως τωρα ειμαι σε ξενα υδατα οποτε δε μπορω να πω κατι παραπανω :cheers:

solaufein · Sep 2, 2015

Αυτά ελέγχονται μόνο με πείραμα, η θεωρία είναι καλή αλλά οι παραμέτροι είναι πολλές για να μπορείς να κρίνεις από "white papers" κλπ.

Εμένα με ανυσηχεί η υποτιθέμενη μείωση του μεριδίου αγοράς της AMD γενικά, και γραφικά και επεξεργαστές. Αμα ελέω κακών οικονομικών συνθηκών στο πλανήτη την πατήσει ... ... ... τη κάτσαμε. Η intel πιθανολογώ με μια δόση υπερβολής έχει ήδη έτοιμο το "blueprint" για το διάδοχο του skylake και απλά δεν έχει κανένα λόγο να μην αρμέξει την αρχιτεκτονική από τη στιγμή που δεν πιέζεται και πολύ από τον αντίπαλο.

kuivamaa · Sep 2, 2015

solaufein wrote:
Αυτά ελέγχονται μόνο με πείραμα, η θεωρία είναι καλή αλλά οι παραμέτροι είναι πολλές για να μπορείς να κρίνεις από "white papers" κλπ.

Εμένα με ανυσηχεί η υποτιθέμενη μείωση του μεριδίου αγοράς της AMD γενικά, και γραφικά και επεξεργαστές. Αμα ελέω κακών οικονομικών συνθηκών στο πλανήτη την πατήσει ... ... ... τη κάτσαμε. Η intel πιθανολογώ με μια δόση υπερβολής έχει ήδη έτοιμο το "blueprint" για το διάδοχο του skylake και απλά δεν έχει κανένα λόγο να μην αρμέξει την αρχιτεκτονική από τη στιγμή που δεν πιέζεται και πολύ από τον αντίπαλο.</blockquote>

Kι ομως ετσι σκάβει το λάκκο της. Αν λχ. εχει πιο ισχυρη αρχιτεκτονική και την κρατάει, χάνει πωλήσεις . Αν εβγαζε μια CPU 60% ταχύτερη του 2500κ ο κόσμος θα αναβάθμιζε μαζικά. Ο λόγος που έχει φρενάρει η ιντελ είναι ότι το x86 εχει σχεδον χτυπήσει ταβανι.

Great0ldOne · Sep 2, 2015

Kuivamaa wrote:
Αν εβγαζε μια CPU 60% ταχύτερη του 2500κ ο κόσμος θα αναβάθμιζε μαζικά.</blockquote>

Σιγά μην ο κόσμος αγόραζε και από δύο τέτοιες CPU ο καθένας.

Ο λόγος που εγώ και πολλοί ακόμα δεν αλλάζουμε τον i5-2500 με ένα i5-6600 που είναι "μόνο" 25% ταχύτερος δεν είναι μόνο οικονομικός - είναι πως και τζάμπα να μου έδιναν έναν επεξεργαστή όχι 60% αλλά 100% πιο γρήγορο, απλά δεν τον χρειάζομαι, και το ίδιο ισχύει για οποιονδήποτε δεν ασχολείται έστω ημι-επαγγελματικά με επεξεργασία βίντεο/εικόνας.

nVidia GPU - Το επίσημο νήμα συζήτησης.

Welcome!

Tarrasque

Todd's Minion

Mind-flayer

Blackguard

Mind-flayer

Todd's Minion

Tarrasque

Mind-flayer

Blackguard

Blackguard

Kraken

Blackguard

Death Knight

Blackguard

Death Knight

Commoner

Blackguard

Mind-flayer

Death Knight

Kraken

Online statistics

Newest members

Stay Connected