it-roy-ru.com

Как я могу умножить и разделить, используя только сдвиг и добавление битов?

Как я могу умножить и разделить, используя только сдвиг и добавление битов?

77
Spidfire

Чтобы умножить с точки зрения сложения и смещения, вы хотите разложить одно из чисел на степени двух, например так:

21 * 5 = 10101_2 * 101_2             (Initial step)
       = 10101_2 * (1 * 2^2  +  0 * 2^1  +  1 * 2^0)
       = 10101_2 * 2^2 + 10101_2 * 2^0 
       = 10101_2 << 2 + 10101_2 << 0 (Decomposed)
       = 10101_2 * 4 + 10101_2 * 1
       = 10101_2 * 5
       = 21 * 5                      (Same as initial expression)

(_2 означает базу 2)

Как видите, умножение можно разложить на сложение, сдвиг и обратно. По этой же причине умножение занимает больше времени, чем сдвиг битов или сложение - это число O (n ^ 2), а не O(n) по количеству бит. Реальные компьютерные системы (в отличие от теоретических компьютерных систем) имеют конечное число битов, поэтому умножение занимает постоянное кратное время по сравнению с сложением и сдвигом. Если я правильно помню, современные процессоры, при правильной конвейеризации, могут выполнять умножение примерно так же быстро, как и сложение, путаясь с использованием ALU (арифметических единиц) в процессоре.

68
Andrew Toulouse

Ответ Эндрю Тулузе может быть расширен до деления.

Деление на целочисленные константы подробно рассмотрено в книге Генри С. Уоррена "Восторг Хакера" (ISBN 9780201914658).

Первая идея для реализации деления состоит в том, чтобы записать обратное значение знаменателя в базе два.

Например, 1/3 = (base-2) 0.0101 0101 0101 0101 0101 0101 0101 0101 .....

Итак, a/3 = (a >> 2) + (a >> 4) + (a >> 6) + ... + (a >> 30) для 32-битной арифметики.

Комбинируя термины очевидным образом, мы можем уменьшить количество операций:

b = (a >> 2) + (a >> 4)

b += (b >> 4)

b += (b >> 8)

b += (b >> 16)

Есть более интересные способы подсчета деления и остатков.

EDIT1:

Если OP означает умножение и деление произвольных чисел, а не деление на постоянное число, то этот поток может быть полезен: https://stackoverflow.com/a/12699549/118265

EDIT2:

Один из самых быстрых способов деления на целочисленные константы - использовать модульную арифметику и сокращение Монтгомери: Какой самый быстрый способ делить целое число на 3?

41
Viktor Latypov

X * 2 = сдвиг влево на 1 бит
X/2 = сдвиг вправо на 1 бит
X * 3 = сдвинуть влево на 1 бит, а затем добавить X

24
Kelly S. French

x << k == x multiplied by 2 to the power of k
x >> k == x divided by 2 to the power of k

Вы можете использовать эти сдвиги для выполнения любой операции умножения. Например:

x * 14 == x * 16 - x * 2 == (x << 4) - (x << 1)
x * 12 == x * 8 + x * 4 == (x << 3) + (x << 2)

Чтобы разделить число не степенью двойки, я не знаю ни одного простого способа, если только вы не хотите реализовать низкоуровневую логику, использовать другие двоичные операции и использовать некоторую форму итерации.

21
IVlad
  1. Сдвиг влево на 1 позицию аналогичен умножению на 2. Правое смещение аналогично делению на 2.
  2. Вы можете добавить в цикл для умножения. Правильно выбрав переменную цикла и переменную сложения, вы можете связать производительность. После того, как вы это изучите, вы должны использовать Peasant Multiplication
17
Yann Ramin

Я перевел код Python на C. В приведенном примере был небольшой недостаток. Если значение дивиденда, которое заняло все 32 бита, сдвиг завершится неудачей. Я просто использовал 64-битные переменные для решения проблемы:

int No_divide(int nDivisor, int nDividend, int *nRemainder)
{
    int nQuotient = 0;
    int nPos = -1;
    unsigned long long ullDivisor = nDivisor;
    unsigned long long ullDividend = nDividend;

    while (ullDivisor <  ullDividend)
    {
        ullDivisor <<= 1;
        nPos ++;
    }

    ullDivisor >>= 1;

    while (nPos > -1)
    {
        if (ullDividend >= ullDivisor)
        {
            nQuotient += (1 << nPos);
            ullDividend -= ullDivisor;
        }

        ullDivisor >>= 1;
        nPos -= 1;
    }

    *nRemainder = (int) ullDividend;

    return nQuotient;
}
6
user2954726

Возьмите два числа, скажем, 9 и 10, запишите их в двоичном виде - 1001 и 1010.

Начните с результата, R, 0.

Возьмите одно из чисел, в данном случае 1010, мы назовем его A, и сдвинем его вправо на один бит, если вы сдвинете одно, добавьте первое число, мы назовем его B, к R.

Теперь сдвиньте B влево на один бит и повторяйте, пока все биты не будут сдвинуты из A.

Проще увидеть, что происходит, если вы видите, что это написано, вот пример:

      0
   0000      0
  10010      1
 000000      0
1001000      1
 ------
1011010
4
Jimmeh

Процедура деления целых чисел, в которой используются сдвиги и сложения, может быть получена прямым способом из десятичного деления на длинные, как преподаются в начальной школе. Выбор каждой факторной цифры упрощается, так как эта цифра равна 0 и 1: если текущий остаток больше или равен делителю, младший значащий бит частичного частного равен 1.

Как и в случае десятичного деления, цифры дивиденда считаются от самых значительных до наименее значимых, по одной цифре за раз. Это легко сделать с помощью левого сдвига в двоичном делении. Кроме того, частичные биты собираются путем сдвига влево текущих частичных битов на одну позицию, а затем добавления нового частного бита.

В классической схеме эти два сдвига влево объединяются в сдвиг влево одной пары регистров. Верхняя половина содержит текущий остаток, нижняя половина - дивиденд. Поскольку биты дивиденда передаются в регистр остатка с помощью сдвига влево, неиспользуемые младшие значащие биты нижней половины используются для накопления частичных битов.

Ниже представлен язык ассемблера x86 и реализации C этого алгоритма. Этот конкретный вариант деления сдвига и сложения иногда называют вариантом "бездействия", поскольку вычитание делителя из текущего остатка не выполняется, если остаток не больше или равен делителю. В Си нет понятия флага переноса, используемого версией сборки в парной регистрах сдвига влево. Вместо этого он эмулируется, основываясь на наблюдении, что результат сложения по модулю 2n может быть меньше, что либо добавить, только если было выполнено.

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>

#define USE_ASM 0

#if USE_ASM
uint32_t bitwise_division (uint32_t dividend, uint32_t divisor)
{
    uint32_t quot;
    __asm {
        mov  eax, [dividend];// quot = dividend
        mov  ecx, [divisor]; // divisor
        mov  edx, 32;        // bits_left
        mov  ebx, 0;         // rem
    $div_loop:
        add  eax, eax;       // (rem:quot) << 1
        adc  ebx, ebx;       //  ...
        cmp  ebx, ecx;       // rem >= divisor ?
        jb  $quot_bit_is_0;  // if (rem < divisor)
    $quot_bit_is_1:          // 
        sub  ebx, ecx;       // rem = rem - divisor
        add  eax, 1;         // quot++
    $quot_bit_is_0:
        dec  edx;            // bits_left--
        jnz  $div_loop;      // while (bits_left)
        mov  [quot], eax;    // quot
    }            
    return quot;
}
#else
uint32_t bitwise_division (uint32_t dividend, uint32_t divisor)
{
    uint32_t quot, rem, t;
    int bits_left = CHAR_BIT * sizeof (uint32_t);

    quot = dividend;
    rem = 0;
    do {
            // (rem:quot) << 1
            t = quot;
            quot = quot + quot;
            rem = rem + rem + (quot < t);

            if (rem >= divisor) {
                rem = rem - divisor;
                quot = quot + 1;
            }
            bits_left--;
    } while (bits_left);
    return quot;
}
#endif
4
njuffa

Взято из здесь .

Это только для деления:

int add(int a, int b) {
        int partialSum, carry;
        do {
            partialSum = a ^ b;
            carry = (a & b) << 1;
            a = partialSum;
            b = carry;
        } while (carry != 0);
        return partialSum;
}

int subtract(int a, int b) {
    return add(a, add(~b, 1));
}

int division(int dividend, int divisor) {
        boolean negative = false;
        if ((dividend & (1 << 31)) == (1 << 31)) { // Check for signed bit
            negative = !negative;
            dividend = add(~dividend, 1);  // Negation
        }
        if ((divisor & (1 << 31)) == (1 << 31)) {
            negative = !negative;
            divisor = add(~divisor, 1);  // Negation
        }
        int quotient = 0;
        long r;
        for (int i = 30; i >= 0; i = subtract(i, 1)) {
            r = (divisor << i);
           // Left shift divisor until it's smaller than dividend
            if (r < Integer.MAX_VALUE && r >= 0) { // Avoid cases where comparison between long and int doesn't make sense
                if (r <= dividend) { 
                    quotient |= (1 << i);    
                    dividend = subtract(dividend, (int) r);
                }
            }
        }
        if (negative) {
            quotient = add(~quotient, 1);
        }
        return quotient;
}
2
Ashish Ahuja

Приведенный ниже метод представляет собой реализацию двоичного деления, учитывая, что оба числа положительные. Если вычитание является проблемой, мы можем реализовать это также с помощью бинарных операторов.

Код

-(int)binaryDivide:(int)numerator with:(int)denominator
{
    if (numerator == 0 || denominator == 1) {
        return numerator;
    }

    if (denominator == 0) {

        #ifdef DEBUG
            NSAssert(denominator==0, @"denominator should be greater then 0");
        #endif
        return INFINITY;
    }

    // if (numerator <0) {
    //     numerator = abs(numerator);
    // }

    int maxBitDenom = [self getMaxBit:denominator];
    int maxBitNumerator = [self getMaxBit:numerator];
    int msbNumber = [self getMSB:maxBitDenom ofNumber:numerator];

    int qoutient = 0;

    int subResult = 0;

    int remainingBits = maxBitNumerator-maxBitDenom;

    if (msbNumber >= denominator) {
        qoutient |=1;
        subResult = msbNumber - denominator;
    }
    else {
        subResult = msbNumber;
    }

    while (remainingBits > 0) {
        int msbBit = (numerator & (1 << (remainingBits-1)))>0?1:0;
        subResult = (subResult << 1) | msbBit;
        if(subResult >= denominator) {
            subResult = subResult - denominator;
            qoutient= (qoutient << 1) | 1;
        }
        else{
            qoutient = qoutient << 1;
        }
        remainingBits--;

    }
    return qoutient;
}

-(int)getMaxBit:(int)inputNumber
{
    int maxBit = 0;
    BOOL isMaxBitSet = NO;
    for (int i=0; i<sizeof(inputNumber)*8; i++) {
        if (inputNumber & (1<<i)) {
            maxBit = i;
            isMaxBitSet=YES;
        }
    }
    if (isMaxBitSet) {
        maxBit+=1;
    }
    return maxBit;
}


-(int)getMSB:(int)bits ofNumber:(int)number
{
    int numbeMaxBit = [self getMaxBit:number];
    return number >> (numbeMaxBit - bits);
}

Для умножения:

-(int)multiplyNumber:(int)num1 withNumber:(int)num2
{
    int mulResult = 0;
    int ithBit;

    BOOL isNegativeSign = (num1<0 && num2>0) || (num1>0 && num2<0);
    num1 = abs(num1);
    num2 = abs(num2);


    for (int i=0; i<sizeof(num2)*8; i++)
    {
        ithBit =  num2 & (1<<i);
        if (ithBit>0) {
            mulResult += (num1 << i);
        }

    }

    if (isNegativeSign) {
        mulResult =  ((~mulResult)+1);
    }

    return mulResult;
}
1
muzz

Это должно работать для умножения:

.data

.text
.globl  main

main:

# $4 * $5 = $2

    addi $4, $0, 0x9
    addi $5, $0, 0x6

    add  $2, $0, $0 # initialize product to zero

Loop:   
    beq  $5, $0, Exit # if multiplier is 0,terminate loop
    andi $3, $5, 1 # mask out the 0th bit in multiplier
    beq  $3, $0, Shift # if the bit is 0, skip add
    addu $2, $2, $4 # add (shifted) multiplicand to product

Shift: 
    sll $4, $4, 1 # shift up the multiplicand 1 bit
    srl $5, $5, 1 # shift down the multiplier 1 bit
    j Loop # go for next  

Exit: #


EXIT: 
li $v0,10
syscall
1
Melsi

Для всех, кто интересуется 16-разрядным решением x86, здесь есть фрагмент кода JasonKnight здесь 1 (он также включает в себя подписанный мультипликатор, который я не проверял). Однако этот код имеет проблемы с большими входами, где часть "add bx, bx" будет переполнена.

Фиксированная версия:

softwareMultiply:
;    INPUT  CX,BX
;   OUTPUT  DX:AX - 32 bits
; CLOBBERS  BX,CX,DI
    xor   ax,ax     ; cheap way to zero a reg
    mov   dx,ax     ; 1 clock faster than xor
    mov   di,cx
    or    di,bx     ; cheap way to test for zero on both regs
    jz    @done
    mov   di,ax     ; DI used for reg,reg adc
@loop:
    shr   cx,1      ; divide by two, bottom bit moved to carry flag
    jnc   @skipAddToResult
    add   ax,bx
    adc   dx,di     ; reg,reg is faster than reg,imm16
@skipAddToResult:
    add   bx,bx     ; faster than shift or mul
    adc   di,di
    or    cx,cx     ; fast zero check
    jnz   @loop
@done:
    ret

Или то же самое в GCC inline Assembly:

asm("mov $0,%%ax\n\t"
    "mov $0,%%dx\n\t"
    "mov %%cx,%%di\n\t"
    "or %%bx,%%di\n\t"
    "jz done\n\t"
    "mov %%ax,%%di\n\t"
    "loop:\n\t"
    "shr $1,%%cx\n\t"
    "jnc skipAddToResult\n\t"
    "add %%bx,%%ax\n\t"
    "adc %%di,%%dx\n\t"
    "skipAddToResult:\n\t"
    "add %%bx,%%bx\n\t"
    "adc %%di,%%di\n\t"
    "or %%cx,%%cx\n\t"
    "jnz loop\n\t"
    "done:\n\t"
    : "=d" (dx), "=a" (ax)
    : "b" (bx), "c" (cx)
    : "ecx", "edi"
);
0
axic