Исповедь системного администратора (многа букаф, мат)

Discussion in 'Off Topic' started by stalke, Aug 8, 2008.

  1. sharky

    sharky Well-Known Member

    Joined:
    Feb 9, 2000
    Messages:
    2,323
    Location:
    Prague, Czech Republic (Ex Mosсow, Ex Omsk, Russia
  2. isaev

    isaev Well-Known Member

    Joined:
    Dec 7, 2007
    Messages:
    5,151
    "Не смотрите вверх!"(С) :)
     
  3. -rust-

    -rust- Well-Known Member

    Joined:
    Jan 23, 2000
    Messages:
    5,231
    При нормальном подходе, с использованием UTF8 - wchar_t не нужен.
    Весь древний софт вдруг начинает работать со всеми возможными кодировками. безо всякого переписывания,
     
  4. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    ыыыыааа.....

    ::ConvertUTF8toUTF16(m_wstrBuf, stTokenBeg, iLength);

    где тут смайлик с фейспальмой?

    https://ru.wikipedia.org/wiki/Широкий_символ

    рыдаю... это ж сколько долбоебизма в головах "создателей" ...
    (я не касался этой темы где-то с 2008 года, когда обнаружил, что мой perl-код, отконверченный с cp2151 на utf8, перестал работать)
    как меня за..али эти переходы lilo->grub, grub->grub2, grub2->grub3, mbr->efi
    и всё, блять, несовместимое...
    ебённый бешенный принтер...
    UTF48 пусть ещё создадут, ублюдки.
     
    Last edited: Aug 29, 2022
  5. sharky

    sharky Well-Known Member

    Joined:
    Feb 9, 2000
    Messages:
    2,323
    Location:
    Prague, Czech Republic (Ex Mosсow, Ex Omsk, Russia
    Зря смеешься ;) есть же UTF-64 и UTF-128
     
  6. rgreat

    rgreat FH Developer

    Joined:
    Jul 19, 2000
    Messages:
    34,229
    Location:
    Russia
    Ну хоть в UTF-128 все влезает... пока.
     
    schuss likes this.
  7. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    бля....
    а зачем оно?
    кому не хватает 4млрд знакомест в таблице символов UTF32 ?

    и зачем было делать wchar_t, которое отлично от utf8/utf16 в разных операциёнках?
     
  8. sharky

    sharky Well-Known Member

    Joined:
    Feb 9, 2000
    Messages:
    2,323
    Location:
    Prague, Czech Republic (Ex Mosсow, Ex Omsk, Russia
    Еще несколько языков. Плюс, будешь смеятся - эмодзи ;)
    int тоже различный в разных аппаратных реализациях, а size_t разный в 32битной и 64 битной платформах ;) и utf-8 это не wchar_t, а char8_t (начиная с с++20), а еще есть char16_t char32_t
     
  9. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    сами топите урановые ломы в ртути
     
    schuss likes this.
  10. soomnvR

    soomnvR Well-Known Member

    Joined:
    Feb 7, 2010
    Messages:
    9,924
    Location:
    somewhere :)
    https://habr.com/ru/news/t/685262/
     
  11. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    порасспрашивал у местного гуру.
    оказывается, wchar_t был придуман задолго до utf8. сразу сделали 2 байта. я даже одобрил. но и технология utf8 тоже прикольная.
    а я ещё помню отрывками: "а чё это выгрузка реестра в текстовый файл даёт такой странный текст, где буковки разжижены пробелами?" - а оно, оказывается, показывало мне в кодировке utf8 текст, написанный в кодировке wchar_t .... вононочо, мехалыч...

    но не могу в голове уместить до сих пор - какого хера им не хватило 65000 символов?????
    ведь даже китайских иероглифов - менее 40000...

    и в то же время - столько интересных символов поудаляли с клавиатуры - знаки "параграф", "бомбочка".
    "диез" есть, а "бемоля" - нету.
    ну хоть "номер" оставили.

    и, ссссуки, до сих пор не могут, блятьнахуй, придумать-реализовать ёбаный РАЗДЕЛИТЕЛЬ ПОЛЕЙ в текстовых файлах.
    всё предлагают ебацца с табуляциями, которые на каждом шагу все меняют на проблемы в разном количестве.
    один ёбаный символ! не могут стандартизовать.
    но при этом, ублюдки, придумываюти стандартизуют UTF128....

    отформатировать нахуй этот "институт стандартов". сборище пидарья какое-то...
     
  12. Sea

    Sea Well-Known Member

    Joined:
    Feb 9, 2001
    Messages:
    23,395
    Location:
    Ukraine, Kiev
    Ваня, не плачь - я тебе символов принес, набираются на клавиатуре.
    ☺☻♥♦♣♠•§µ½♪♫¤

    https://www.alt-codes.net/
     
  13. Sea

    Sea Well-Known Member

    Joined:
    Feb 9, 2001
    Messages:
    23,395
    Location:
    Ukraine, Kiev
    Кажется как раз сегодня, проблем с переносом инфы через файлы, да хоть тот же csv вообще проблем нет. Конечно, если его не копировали три раза ворд-ехель-ворд с передачей через смс - тогда да, возможны проблемы.
     
  14. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    с одной стороны - экономят место, вместо wchar_t придумывают utf8, а с другой стороны - тямы не хватает ввести новый символ "разделитель полей" - так и хуярят в csv через запятую нечто окавыченное - и им, блять, похуй на то, что аж на 2 символа на каждое поле больше тратится.
     
  15. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    с клавиатуры убрали. со 105 клавиш.
    а так-то, через ALT+code - это оно могёт. только вот как вспомнить всё?

    и да, Alt+001 не работает в google-chrome - оно перехватывает нажатия клавиш и переключает вкладку на 1-ю.
     
  16. sharky

    sharky Well-Known Member

    Joined:
    Feb 9, 2000
    Messages:
    2,323
    Location:
    Prague, Czech Republic (Ex Mosсow, Ex Omsk, Russia
    Вань ты чего то уже заговариваться начал. При выгрузке реестра в текст не utf8, а UTF16LE. utf8 более всратая кодировка. В ней нельзя точно сказать сколько байтов займет нужный символ. от 1 до 6. А utf16 и utf32 имеют фиксированную ширину. Для ASCII довольно избыточно иметь 4 байта на символ, как и для языков тех стран в которых уже были компутеры, потому поначалу и сделали wchar_t в 2 байта. Память экономили.
     
    Last edited: Aug 30, 2022
  17. Sea

    Sea Well-Known Member

    Joined:
    Feb 9, 2001
    Messages:
    23,395
    Location:
    Ukraine, Kiev
    alt+1 = ☺

    ps: пожертвуй каким-то символом и замени его на нужный. Я правда, не занимался этим вопросом, хз как сделать. Или с раскладками поиграйся, вплоть до сделать свою.
     
  18. Sea

    Sea Well-Known Member

    Joined:
    Feb 9, 2001
    Messages:
    23,395
    Location:
    Ukraine, Kiev
    Да, я помню как ты от xml пылал аки доменная печь! То да, два лишних символа на поле жутчайший перерасход байтов... Но, я не понимаю, почему оно тебя волнует. У меня один софт прайсы перемалывает, то там тебе и xml, json, xls, xlsx и да, был csv но его выкинули нафиг так как в описании товаров попадаются и кавычки и запятые и еще фиг знает что от чего тот csv и вручную фиг распарсишь.
     
  19. rgreat

    rgreat FH Developer

    Joined:
    Jul 19, 2000
    Messages:
    34,229
    Location:
    Russia
    Правильный CSV, с escape символами надо уметь генерить и парсить.

    Если уметь - остальные форматы (кроме бинарника) по экономности выгрузки таблиц ему и в подметки не годятся.
     
  20. mcgru-

    mcgru- Well-Known Member

    Joined:
    Sep 21, 2000
    Messages:
    57,028
    Location:
    Tomsk, Russia
    ничего не заговариваюсь.
    я и говорю, что из реестра выгружается в чём-то двухбайтном. не уверен - wchar_t там или utf16le.
    просто раньше удивлялся, не особо акцентируясь. а теперь вот понятно стало с этими разъяснениями про то что раньше появилось - utf8 или wchar_t