Re[3]: Безопасно ли присваивать один указатель другому?..
От: lastcross  
Дата: 23.03.18 16:57
Оценка:
O>Но вот наткнулся на примерно такой код (сильно упрощен):

Точно падает в присвоении ?? Тут например не хочет падать http://coliru.stacked-crooked.com/a/8d2dea8e83a98c19 и даже так http://coliru.stacked-crooked.com/a/4e8c07ee945250e9
Отредактировано 23.03.2018 16:59 lastcross . Предыдущая версия .
Re[3]: Безопасно ли присваивать один указатель другому?..
От: Croessmah  
Дата: 23.03.18 17:27
Оценка: 37 (4) +2
Здравствуйте, okman, Вы писали:
O>Хотелось бы понять, насколько такое поведение (т.е. разыменование указателя, возможно висячего,
O>при выполнении приведений типов по иерархии наследования) легально с точки зрения стандарта C++.
O>Или же это сугубо implementation-defined?..


Если я правильно понял, то Вы наткнулись на неопределенное поведение при преобразовании указателей:


С++14
12.7 Construction and destruction

3. To explicitly or implicitly convert a pointer (a glvalue) referring to an object of class X to a pointer (reference) to a direct or indirect base class B of X, the construction of X and the construction of all of its direct or indirect bases that directly or indirectly derive from B shall have started and the destruction of these classes shall not have completed, otherwise the conversion results in undefined behavior. To form a pointer to (or access the value of) a direct non-static member of an object obj, the construction of obj shall have started and its destruction shall not have completed, otherwise the computation of the pointer value (or accessing the member value) results in undefined behavior.
[Example:

struct A { };
struct B : virtual A { };
struct C : B { };
struct D : virtual A { D(A*); };
struct X { X(A*); };



struct E : C, D, X { //undefined: upcast from E* to A*
    E() : D(this),   //might use path E* → D* → A*
                     // but D is not constructed
                     // D((C*)this), // defined:
                     // E* → C* defined because E() has started
                     // and C* → A* defined because
                     // C fully constructed
    X(this) {        // defined: upon construction of X,      
    }                // C/B/D/A sublattice is fully constructed            
};
— end example ]


То есть для Вашего случая сначала необходимо сделать преобразование (присваивание) пока объект не уничтожен, и только затем удалять объект:

    Base * p2;
    p2 = p1;
    delete p1;
    printf("p2 = %p\r\n", (void *)p2);//Ok
Re[3]: Безопасно ли присваивать один указатель другому?..
От: AlexGin Беларусь  
Дата: 23.03.18 20:10
Оценка:
Здравствуйте, okman, Вы писали:

O>
O>#include <cstdio>

O>struct Base
O>{
O>    virtual ~Base() {}
O>};

O>struct X1 : public virtual Base {};
O>struct X2 : public virtual Base {};
O>struct Child : public X1, public X2 {};

O>int main()
O>{
O>    X1 * p1 = new X1();
O>    delete p1;
O>    Base * p2;
O>    p2 = p1;
O>    printf("p2 = %p\r\n", (void *)p2);
O>    return 0;
O>}
O>

O>При запуске на VS2015 или VS2008 в режиме Debug программа падает на строке 'p2 = p1':
У меня также (на VS2015) данный пример падает на строке 'p2 = p1'

После чего я изменил пример так:
#include <cstdio>

struct Base
{
    virtual ~Base() {}
};

struct X1 : public virtual Base {};
struct X2 : public virtual Base {};
struct Child : public X1, public X2 {};

int main()
{
    X1 * p1 = new X1();
    delete p1;
    X1 * p2; // Эта строка изменена!!!
    p2 = p1;
    printf("p2 = %p\r\n", (void *)p2);
    return 0;
}

...и все падения прекратились!

O>Или же это сугубо implementation-defined?..

+100500
ИМХО похоже именно на это.
Re[3]: Безопасно ли присваивать один указатель другому?..
От: zou  
Дата: 23.03.18 22:15
Оценка: 23 (3) +2
Здравствуйте, okman, Вы писали:

На стандарт ссылку не дам, но, думаю, суть в том, что при присваивании p2 = p1 происходит не просто копирование, а преобразование адреса, для которого требуется прочитать RTTI. Если адрес p1 невалидный, то при обращении к RTTI происходит исключение. В случае валидного адреса p1, переменная p2 будет содержать адрес с неким смещением.
Re[4]: Безопасно ли присваивать один указатель другому?..
От: okman Беларусь https://searchinform.ru/
Дата: 24.03.18 04:15
Оценка:
Здравствуйте, Croessmah, Вы писали:

C>Если я правильно понял, то Вы наткнулись на неопределенное поведение при преобразовании указателей:

C>...

Спасибо, именно эта цитата все объясняет:

To explicitly or implicitly convert a pointer (a glvalue) referring to an object of class X to a
pointer (reference) to a direct or indirect base class B of X, the construction of X and the construction
of all of its direct or indirect bases that directly or indirectly derive from B shall have
started and the destruction of these classes shall not have completed, otherwise the conversion
results in undefined behavior.


C>То есть для Вашего случая сначала необходимо сделать преобразование (присваивание) пока объект не уничтожен, и только затем удалять объект:

C>...

Похоже, что разработчики библиотек в курсе про этот нюанс. Вот нашел в исходниках
Boost 1.66.0 следующий комментарий (/boost/smart_ptr/weak_ptr.hpp):
//
//  The "obvious" converting constructor implementation:
//
//  template<class Y>
//  weak_ptr(weak_ptr<Y> const & r): px(r.px), pn(r.pn)
//  {
//  }
//
//  has a serious problem.
//
//  r.px may already have been invalidated. The px(r.px)
//  conversion may require access to *r.px (virtual inheritance).
//
//  It is not possible to avoid spurious access violations since
//  in multithreaded programs r.px may be invalidated at any point.
//

Судя по всему, они подразумевают примерно такой кейс:
shared_ptr<X1> ptr = ...;
weak_ptr<X1> w1(ptr);
ptr.reset();
weak_ptr<Base> w2(w1); // BANG!

Глянул реализацию std::weak_ptr в VS2015 — там тоже учтен этот момент.
Re[4]: Безопасно ли присваивать один указатель другому?..
От: Meyers  
Дата: 24.03.18 04:48
Оценка:
Здравствуйте, Croessmah, Вы писали:

C>Если я правильно понял, то Вы наткнулись на неопределенное поведение при преобразовании указателей:


Цитата из стандарта относится к objects under construction or destruction:
"[class.base.init] and [class.cdtor] (процитированное) describe the behavior of objects during the construction and destruction phases" — (http://eel.is/c++draft/basic.life#4.sentence-4)

Я не говорю, что там не UB, но цитата не та, т.к. там преобразование указателей было не во время создания или удаления объекта.
Re: Безопасно ли присваивать один указатель другому?..
От: Teolog  
Дата: 24.03.18 08:16
Оценка: -1
Абсолютно безопасно за исключением случая с указателем на виртуальную функцию, который имеет извращенный тип.
Проблемы могут возникнуть исключительно в момент разименования.
Более того, данная операция атомарна и соответственно потокобезопасна на любой архитектуре у которой размер типа указателя меньше либо равен разрядности процессора.
Возможно на некоторых других то-же, но это надо смотреть документацию.
Так что можно пользоваться невозбранно за исключением хитрых embeded систем у которых память адресуется по банкам.

но правильно такая операция пишеться
TypeA * a;
TypeB * b;
a=reinterpret_cast<TypeA *>(b);
Потому что при простом приравнивании для указателей на родственные классы начинает работать таинственная адресная магия, которая требует возможности их разименования.
Отредактировано 24.03.2018 8:22 Teolog . Предыдущая версия .
Re: Безопасно ли присваивать один указатель другому?..
От: Кодт Россия  
Дата: 25.03.18 15:54
Оценка:
Здравствуйте, okman, Вы писали:

O>Как думаете, возможно ли в C или C++ получить какой-нибудь побочный эффект во время

O>присваивания одного указателя другому? Т.е., упрощенно говоря, может ли программа упасть
O>на выполнении простой конструкции типа x = y? Считаем, что x и y — это самые обычные
O>"сырые" указатели, т.е. не смарт-поинтеры, не классы с переопределенным оператором
O>присваивания и ничего такого, а просто самые обычные указатели:
O>Или такое присваивание всегда безопасно, даже если сами указатели содержат null или "мусор"?

Можно получить не идемпотентное поведение.
Derived* d;

Base* b = d;  // up-cast разрешён всегда
Derived* d1 = static_cast<Derived*>(b);  // down-cast должен быть явным
Base* b1 = d1;

assert(d == d1);
assert(b == b1);

Логично?
А вот если так:
https://ideone.com/vp8AOz
#include <iostream>
#include <cassert>
using namespace std;

struct Alfa { char t[1024]; };
struct Base { char u[1024]; };
struct Derived: Alfa, Base { char v[1024]; };

Derived* downcast(Base* b) {
  return static_cast<Derived*>(b);
}

void test_bd(Base* b) {
  Derived* d = downcast(b);
  cout << "bd::" << b << " " << d << endl;
}

void test_dbd(Derived* d) {
  Base* b = d;
  const char* isnull = (b == nullptr) ? "" : "!=nullptr";
  const char* iszero = (intptr_t)(b) == 0 ? "" : "!=zero";
  Derived* d1 = downcast(b);
  cout << "dbd:" << d << " " << b << isnull << iszero << " " << d1 << " " << endl;
  test_bd(b);
}

void test_bdb(Base* b) {
  Derived* d = downcast(b);
  Base* b1 = d;
  cout << "bdb:" << b << " " << d << " " << b1 << endl;
}

int main() {
  test_dbd((intptr_t)0);                  // 0 0 0 / 0 0
  test_bdb((intptr_t)0);                  // 0 0 0
  test_dbd((Derived*)(intptr_t)(-1024));  // 0xfffffffffffffc00 0!=nullptr!=zero 0xfffffffffffffc00 / 0 0
  test_bdb((Base*)(intptr_t)(1024));      // 0x400 0 0
}

Обратите внимание на третий случай. Там компилятор видит 0, но отказывается верить, что это 0.

А всё потому, что адресная арифметика за пределами массива и смещение базы невалидных указателей — неопределённое поведение.

(nullptr и указатель за концом массива — это валидные, но неразыменовываемые)


И это, заметьте, безо всяких там виртуальных наследований, — где попытка даже апкаста для невалидного указателя приведёт к стрельбе по памяти.
struct A { int x; };
 
struct B : virtual A { int y; };
 
int main() {
    B* b = (B*)(intptr_t(100500));
    A* a = b;
    cout << b << " " << a << endl;
}
Перекуём баги на фичи!
Re: Безопасно ли присваивать один указатель другому?..
От: Pavel Dvorkin Россия  
Дата: 25.03.18 16:09
Оценка:
Здравствуйте, okman, Вы писали:

O>Или такое присваивание всегда безопасно, даже если сами указатели содержат null или "мусор"?


Ответ в рамках существующих систем — безопасно.

Ответ формальный — нет. Потому что указатель — это не адрес вообще-то, а лишь нечто такое, применение к которому операции дерефренсирования дает доступ к объекту, на который он указывает.

Механизм этого дерефренсирования может в принципе быть любым.

Поэтому и механизм копирования указателя может в принципе быть любым, а значит, и содержать в себе любые проверки, которые не пройдут при некорректном присваивании.

Все это очень далеко от реальности и чисто умозрительно. Но не невозможно в принципе.
With best regards
Pavel Dvorkin
Re[2]: Безопасно ли присваивать один указатель другому?..
От: Meyers  
Дата: 25.03.18 19:39
Оценка:
Здравствуйте, Pavel Dvorkin, Вы писали:

PD>Здравствуйте, okman, Вы писали:


O>>Или такое присваивание всегда безопасно, даже если сами указатели содержат null или "мусор"?


PD>Ответ в рамках существующих систем — безопасно.


http://rsdn.org/forum/cpp.applied/7090690.1
Автор: okman
Дата: 23.03.18
Re[3]: Безопасно ли присваивать один указатель другому?..
От: SaZ  
Дата: 26.03.18 08:38
Оценка:
Здравствуйте, AlexGin, Вы писали:

AG>...


AG>Скажем так: это далеко не (void *), а более сложный тип — вот как первый параметр в _beginthread:

AG>...

Честно прочитал все ссылки. Что-либо по моему вопросу будет? Интересует, например, чему должен быть равен sizeof указателя на метод?
Re: Безопасно ли присваивать один указатель другому?..
От: uzhas Ниоткуда  
Дата: 26.03.18 11:06
Оценка:
Здравствуйте, okman, Вы писали:

O>Как думаете, возможно ли в C или C++ получить какой-нибудь побочный эффект во время

O>присваивания одного указателя другому?

если приемник плохо выровнен, то это UB и на практике приводит к bus error

зы. я твой пример уже прочитал, зачётно. просто решил пополнить множество вариантов
Re[4]: Безопасно ли присваивать один указатель другому?..
От: antonio_banderas Россия  
Дата: 26.03.18 11:23
Оценка: 7 (1) +1
Здравствуйте, zou, Вы писали:

zou>Здравствуйте, okman, Вы писали:


zou>На стандарт ссылку не дам, но, думаю, суть в том, что при присваивании p2 = p1 происходит не просто копирование, а преобразование адреса, для которого требуется прочитать RTTI. Если адрес p1 невалидный, то при обращении к RTTI происходит исключение. В случае валидного адреса p1, переменная p2 будет содержать адрес с неким смещением.


Как раз примерно это же хотел ответить.
При обычном (невиртуальном) наследовании все смещения при "хождении" по иерархии классов (т.е. при преобразовании указателей в пределах иерархии наследования) известны во время компиляции.
А вот при виртуальном наследовании смещение во время компиляции уже неизвестно и его нужно взять из таблицы смещений (или как она называется), к которой обращаемся через vptr, а в случае мертвого объекта vptr уже невалиден. Отсюда и падение.
Отредактировано 26.03.2018 11:28 antonio_v_krasnom . Предыдущая версия .
Re[4]: Безопасно ли присваивать один указатель другому?..
От: SaZ  
Дата: 26.03.18 13:26
Оценка:
Здравствуйте, zou, Вы писали:

zou>Здравствуйте, okman, Вы писали:


zou>На стандарт ссылку не дам, но, думаю, суть в том, что при присваивании p2 = p1 происходит не просто копирование, а преобразование адреса, для которого требуется прочитать RTTI. Если адрес p1 невалидный, то при обращении к RTTI происходит исключение. В случае валидного адреса p1, переменная p2 будет содержать адрес с неким смещением.


А если кастануть как-то типа (Base *)(void *)p2;? Какие тут могут быть подводные камни? Как я понимаю, для простой печати адреса объекта — так делать можно. Про RTTI я тоже понял, просто уж очень экзотический случай
Re[4]: Безопасно ли присваивать один указатель другому?..
От: AlexGin Беларусь  
Дата: 26.03.18 13:56
Оценка: -3
Здравствуйте, SaZ, Вы писали:

SaZ>Честно прочитал все ссылки. Что-либо по моему вопросу будет?

Вроде выше, в моём ответе, было именно по твоему вопросу (по поводу void*).

SaZ>Интересует, например, чему должен быть равен sizeof указателя на метод?


sizeof указателя на метод — такой же, как sizeof(int*);
В общем — sizeof такой же, как у всех других указателей в приложениях данной архитектуры (то есть 4 байта для x86; 8 байт для x64).

class Foo 
{
public:
    int f(string str) 
    {
        std::cout << "Foo::f()" << std::endl;
        return 1;
    }
};

int main()
{
    int (Foo::*fptr) (string) = &Foo::f;
    std::cout << "sizeof-fptr=" << sizeof(fptr) << std::endl;
    ...
    return 0;
}


P.S. Вот ещё раз даю ту же самую полезную ссылочку:
https://www.codeguru.com/cpp/cpp/article.php/c17401/C-Tutorial-PointertoMember-Function.htm
более толкового описания по данной теме — я не видел.
Отредактировано 26.03.2018 14:03 AlexGin . Предыдущая версия .
Re[5]: Безопасно ли присваивать один указатель другому?..
От: SaZ  
Дата: 26.03.18 14:18
Оценка:
Здравствуйте, AlexGin, Вы писали:

AG>

AG>sizeof указателя на метод — такой же, как sizeof(int*);
AG>В общем — sizeof такой же, как у всех других указателей в приложениях данной архитектуры (то есть 4 байта для x86; 8 байт для x64).

Можно не так голословно?

AG>P.S. Вот ещё раз даю ту же самую полезную ссылочку:

AG>https://www.codeguru.com/cpp/cpp/article.php/c17401/C-Tutorial-PointertoMember-Function.htm
AG>более толкового описания по данной теме — я не видел.

Ещё раз. Ссылки я прочитал. Не нужно их дублировать по 100 раз. Лучше вот это объясните:
https://ideone.com/3WjDKl
#include <iostream>
#include <string>
 
struct A
{
    virtual void f() = 0;
};
 
struct B : A
{
    void f() override {}
};
 
int main()
{
    const auto p = &B::f;
    const bool ok = sizeof(void *) == sizeof( p );
    if ( !ok )
        std::cout << "Not OK";
    return 0;
}
Re[5]: Безопасно ли присваивать один указатель другому?..
От: night beast СССР  
Дата: 26.03.18 14:41
Оценка:
Здравствуйте, AlexGin, Вы писали:

SaZ>>Честно прочитал все ссылки. Что-либо по моему вопросу будет?

AG>Вроде выше, в моём ответе, было именно по твоему вопросу (по поводу void*).

SaZ>>Интересует, например, чему должен быть равен sizeof указателя на метод?

AG>
AG>sizeof указателя на метод — такой же, как sizeof(int*);
AG>В общем — sizeof такой же, как у всех других указателей в приложениях данной архитектуры (то есть 4 байта для x86; 8 байт для x64).

это не так.
как минимум на старых студиях под 32 бита этот размер был 8.
с указателем на обычную функцию тоже никаких гарантий не было что можно безопасно к void* кастить.
Re[6]: Безопасно ли присваивать один указатель другому?..
От: AlexGin Беларусь  
Дата: 26.03.18 14:56
Оценка: -2
Здравствуйте, SaZ, Вы писали:
...
SaZ>Лучше вот это объясните:
SaZ>https://ideone.com/3WjDKl
...
Издержки онлайнового ideone.com

У меня в MSVC2015

#include "stdafx.h"
#include <iostream>
#include <string>

struct A
{
    virtual void f() = 0;
};

struct B : A
{
    void f() override {}
};

int main()
{
    const auto p = &B::f;
    const bool ok = sizeof(void *) == sizeof(p);
    if (!ok)
        std::cout << "Not OK"; 

    std::cout << "sizeof(void *) = " << sizeof(void *) << std::endl; 
    std::cout << "sizeof(p) = " << sizeof(p) << std::endl;

    getchar();
    return 0;
}


Вывод для MSVC2015 (x86):
sizeof(void *) = 4
sizeof(p) = 4

Вывод для MSVC2015 (x64):
sizeof(void *) = 8
sizeof(p) = 8

Верю студии!

вывод для http://rextester.com/l/cpp_online_compiler_visual
sizeof(void *) = 8
sizeof(p) = 8

Здесь (в cpp_online_compiler_visual) также вроде логично.

вывод для ideone.com:
аналогично для https://wandbox.org:
аналогично для http://cpp.sh (в режиме Cpp-11):
Not OKsizeof(void *) = 8
sizeof(p) = 16

Насчёт http://rextester.com:
cpp_online_compiler_gcc также:
и cpp_online_compiler_clang:

Not OKsizeof(void *) = 8
sizeof(p) = 16

Странно...
По крайней мере, у меня здесь нет логичного объяснения.
Отредактировано 26.03.2018 15:18 AlexGin . Предыдущая версия . Еще …
Отредактировано 26.03.2018 15:17 AlexGin . Предыдущая версия .
Re[6]: Безопасно ли присваивать один указатель другому?..
От: AlexGin Беларусь  
Дата: 26.03.18 15:03
Оценка:
Здравствуйте, night beast, Вы писали:

NB>Здравствуйте, AlexGin, Вы писали:


SaZ>>>Честно прочитал все ссылки. Что-либо по моему вопросу будет?

AG>>Вроде выше, в моём ответе, было именно по твоему вопросу (по поводу void*).

SaZ>>>Интересует, например, чему должен быть равен sizeof указателя на метод?

AG>>
AG>>sizeof указателя на метод — такой же, как sizeof(int*);
AG>>В общем — sizeof такой же, как у всех других указателей в приложениях данной архитектуры (то есть 4 байта для x86; 8 байт для x64).

NB>это не так.

Я здесь привёл примеры для MSVC2015 — всё вполне логично (размеры указателей одинаковы).
Здесь у меня под рукой нет другой студии (дома проверю под MSVC2008, но более древних не найду).

NB>как минимум на старых студиях под 32 бита этот размер был 8.

NB>с указателем на обычную функцию тоже никаких гарантий не было что можно безопасно к void* кастить.

Где хоть какое-то объяснение данному феномену?

Указатель — это адрес в памяти.
Как он может иметь разные размерности в одном и том же процессе?
Re[7]: Безопасно ли присваивать один указатель другому?..
От: uzhas Ниоткуда  
Дата: 26.03.18 15:27
Оценка: 6 (2) +1
Здравствуйте, AlexGin, Вы писали:

AG>Как он может иметь разные размерности в одном и том же процессе?


рекомендую к прочтению: https://stackoverflow.com/questions/16062651/about-sizeof-of-a-class-member-function-pointer
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.