Судья Ставриецкий: “На конкурс поступило девятнадцать этюдов от двенадцати авторов из шести стран: Австрия, Азербайджан, Израиль, Россия, Словакия и Швейцария. Этюдисты представили очень хорошие этюды”.
Приятно смотреть присуждения, где судья высказывает свое мнение о каждом отмеченном этюде. Жаль, что приводятся лишь главные варианты, а шахматный движок не может помочь с анализом, потому что он не понимает файл pdf. Он просит PGN. Организаторы конкурса такого файлика не предоставили. За окном 2025 год, страна уже 100 лет ведет своих пенсионеров в светлое будущее, а проводить конкурсы по современным стандартам никто не хочет. Пришлось собирать PGN по частям. Сканер диаграмм Chessvision почему-то плохо видит диаграммы в pdf-ке, и я подсовывал их ему по одной, а он выдавал мне FEN позиции. Потом я попросил нейросеть запихнуть все эти fen-ки в одну pgn-ку, и добавить ходы. Пока объяснил ей, что и как надо делать, устал еще больше, чем делал бы все сам вручную. Поэтому решил, что в этот раз нейросеть будет оценивать этюды вместо меня. С этим заданием она справилась очень быстро.
– Напиши 10 основных критериев для оценки красоты шахматного этюда.
1. Идея (тема). 2. Парадоксальность. 3. Экономичность. 4. Гармония начальной позиции. 5. Красивые финальные позиции. 6. Развитие игры. 7. Жертвы и неожиданные ресурсы. 8. Глубина расчёта. 9. Эстетика борьбы. 10. Художественное впечатление.
– Разъясни детальнее критерии 6 и 9.
Развитие игры или многоступенчатость решения – наличие нескольких планов или тем, раскрывающихся постепенно.
Глубина критерия. Этюд ценится выше, если он содержит логические переходы между разными фазами. Это может быть смена стратегии, неожиданный поворот событий или переход от одной идеи к другой.
Разновидности развития игры.
Смена темпа: сначала игра на пат, потом форсированный мат.
Переходная стадия: сначала тактика, потом эндшпильная игра.
Обманный манёвр: первый план кажется рабочим, но истинное решение сложнее.
Эстетика борьбы – взаимодействие фигур, контригра.
Глубина критерия. Этюд должен передавать драматургию шахматной борьбы.
Типы эстетики. Борьба за темп. Постепенное ограничение свободы. Иллюзия безопасности перед неминуемым ударом
– Оцени этюды конкурса по этим критериям. Шкала идеи от 0 до 20, остальные критерии от 0 до 5.
Лучшие этюды (61-60/65): Hergert и Pervakov – насыщенные, парадоксальные и гармоничные, с глубокой стратегией и эффектным финалом.
Сильные этюды (56-53/65): Hergert (второй этюд) – включает длинные маневры и борьбу всех фигур до самого конца Arestov & Afek – высоко оценен за точность и лаконичность, Osintsev – чёткая идея, развитие игры.
Средний уровень (52-48/65): Pasman, Arestov & Krug, Migunov, Hlinka & Kekely – менее эффектные, концовка предсказуема, а развитие менее насыщенное.
Самый слабый (44/65): Второй этюд Migunov – хороший, но не столь драматичный и глубокий.
Special prize by Hergert das ist plagiat https://eg.org.ua/chessgame/gonzalezl-0141-01e2h8/
I would like to point to parts (III), (XI) and (XII) of my “It is really that simple” series.
https://endgame-studies.jimdofree.com/articles/dtz-material/it-is-really-that-simple-i-xii/
The 2-click method is dangerous for reputation. Especially, when one is not the first to discover a chewing-gum position.
It seems that nobody used the position of the first study before Hergert. Lucky son of a witch! Of course, it was taken from Syzygy too – place 2 bishops, 2 knights and a pawn anywhere on the board and visit the 4th link in the bottom right corner – that’s all one has to do to compose this study.
Volker is completely desperate. He has never worked with this tool before and he assured me that he was not familiar with Gonzalez’s study. But it’s amazing that his other study can also be created with 2 clicks.
Hergert’s first study is magical. It is either from Syzygy or from Hogwarts School of Witchcraft and Wizardry. But it doesn’t matter. It is original anyway.
I hope he can smile a bit, when he reads this.
Pervakov’s position after 4.Nf4+ differs from the (mirrored) 2-click example KBNN vs KQ after 1.Nf4+ only by the position of the bishop (c7 vs d6). Then the play seems to be identical until 12.. Qa5 vs 9.. Qd2 apart of the bishop being on neighbouring diagonals, of course. It happens to the best!
https://eg.org.ua/chessgame/rinckh-3012-00c5a7/
I tried to get a first impression of how often composers reached a 2-click position in the past: https://endgame-studies.jimdofree.com/articles/dtz-material/first-systematic-research/
A well-deserved first prize for Volker! I can confirm what Martin said: Volker is not a miner and has often been unlucky with respect to predecessors. So this time he deserves to be lucky.
I really like this miniature. It has a lot of paradoxical elements and quite clear lines. The only disadvantage is that it asks for a lot of attention from the enthusiast who is playing it through because the study is very long and there are a lot of junctions. Like a late Beethoven string quartet: minimalistic but dense and demanding to listen.
I also like Oleg’s shared first prize, but it looks a bit more conventional to me.
Also Pasman’s third prize makes a very good impression on me. The play and the ideas are clear. Both sides push their pawns with the help of tactical tricks and in the end, the bishop manages to dominate the rook. The rundlauf of the bishop is impressive and the stalemate avoidance with Bc6 is a nice cherry on the cake.
Добавлю свое мнение. Мой подход к оценке этюдов кардинально отличается от того, который был использован в беседе с ChatGPT. Эксперимент показал, что красиво объяснять художественные критерии могут не только Гурвич и Шпренгер. Это по силам даже тому, кто совсем не умеет составлять, не имеет багажа идей, чтобы их сравнивать между собой, и как-то оценить их силу, оригинальность и качество. Нейросеть способна оценивать лишь то, что лежит на поверхности: ходы без взятий, жертвы, длину маневров, начальную позицию. И этого достаточно, чтобы не выглядеть профаном.
Основа любого этюда – его идея. Ее оценка составляет не 20% от общей суммы учитываемых критериев. И даже не 50%. Идея задает максимальный балл, который может получить этюд. За нарушение художественных критериев этот балл урезается, иногда даже очень сильно. Особенно за невыразительность вариантов. Слишком сложные и длинные варианты портят этюд, а не поощряются, потому что они размывают главную идею.
Самые мощные и интересные идеи в трех первых этюдах.
В этюде Первакова – жертва черного коня перекрывает батарею, но белые серией точных шахов (не одним ходом, а маневром) сбрасывают коня-препятствие и «отменяют» замысел черных (хотя без предвидения жертвы черных не совсем то, что представители логической школы вкладывают в термин отмена). Эта оригинальная идея срослась с известным финалом Ринка. Оригинальности достаточно. Для меня это второй лучший этюд в конкурсе.
Этюд Пасмана, по-моему, должен быть выше. Его главная идея в дуэли черной ладьи с белым слоном. Немедленное проведение пешки проигрывает из-за Bc6+ с подхватом поля а8, поэтому сначала ладья загоняет слона на g6. Белый слон отыгрывается промежуточным шахом Be4+! Ладья не сдается, идет на пат. А слон приносит себя в жертву. Замечательный сюжет.
Этюд Хергерта в этой компании лишь третий. Комбинируя угрозу перевода своего коня на g3 с аккуратными ходами королем, белые сгоняют черного коня c e3 на менее удобное поле f4, что позволяет перевести слона на большую диагональ (дуаль Bc8-b7/Bd7-c6). Хорошо, что белые идут к цели поэтапно: сгоняют коня, переводят слона и добивают батареей. Но на такой дистанции, хотелось бы от них несколько эффектных ходов. Без них скучновато.
Regarding your experiment, doesn’t it show some limits of the AI assessment? The neural network underrates Pasman’s study, which the humans would rank at a similar level as the two tournament winners (in your case, even higher).
Moreover, the neural network seems to overrate the Arestov & Afek study (the lines are not really connected and the content looks familiar).
I agree, however, with the neural network that Osintsev’s study should deserve a higher rank than a third HM.
Regarding your approach that the idea sets the maximum score and that violations of aesthetic criteria diminish it, I mostly agree, though I believe that there are exceptions. This is because the idea and the (beauty of the) play are no two separate categories, but interact with each other.
There seems to be widespread agreement among the humans that the three first prizes are actually the three best studies. The differences concern nuances. I would put Hergert’s and Pasman’s study before Pervakov’s because they have more meaningful counterplay and a less conventional and forced plot. (That the final in Pervakov’s study is known is not a big problem, but perhaps not ideal either.)
As to the choice between Hergert’s and Pasman’s study, it depends on whether one likes the highly uncommon and cognitively demanding plot of Hergert’s study, without getting distracted by its length, or whether one prefers the clear ideas and the seamless flow in Pasman’s study. Bruckner vs. Mendelssohn.
As to the choice between Hergert’s and Pasman’s studies, it depends on whether the more powerful idea of Hergert after deduction of “points” for boring play on a restricted area of the board and a dual doesn’t lose to an simpler idea of Pasman which is implemented better.
The unity of content and form means that the idea sets a maximum score in case of ideal beauty of play. The idea and the beauty of play are not separated.
The problem with neural network is it cannot assess ideas at all. So, we might think it is worthless because the idea is 100% of score (or whatever the unity of content and form means to you).
However neural network can (or can learn to) evaluate the beauty of play. And its ranking doesn’t differ much from yours.
Of course, neural network changes its scores constantly. So, when it is asked to assess the same studies 20 times, the total of points will be almost the same for each study. Stupid AI 🙂
WCCI submissions are public. Have you thought about letting the AI do an evaluation?
Well, it may be fun and for sure – a waste of time. AI is useless for evaluation of studies, though it writes about criteria even better than Gurvich. In fact, that’s what AI was trained to do – speak beautifully and change its opinion in a second.
Yes, I agree. A few weeks ago I published a talk with Perplexity AI from last November.
https://endgame-studies.jimdofree.com/articles/a-composing-ai/
There was a second half in this conversion about the best and most well-known composers. HvdH would love to read it!
You are absolutely right 🙂